-
Notifications
You must be signed in to change notification settings - Fork 0
/
settings.py
29 lines (22 loc) · 1.16 KB
/
settings.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
import os
# FILTRE pour le scrap
FILTRE = (r"\d+\s*\(\d+\s*votes?\)|\d+.|TagsTopsLiensPartenariatDernièresSagasPersonnagesÀ "
r"proposMosaïqueProposerMentions légales|TagsTopsLiensPartenariatDernièresSagasPersoÀ "
r"proposMosaïqueProposerMentions légales"
r"|Saga|Traduction")
FILTRE_syntax = ["Dr.", "C.I.A", "J.", "2."]
# Data json
path_movie = os.path.join(os.path.dirname(__file__), 'data/data_movies.json')
path_quote = os.path.join(os.path.dirname(__file__), 'data/data_quote.json')
base_data = {"ids": [],
"quotes": [],
"character": []
}
# Setting
url_movie = "https://www.kaakook.fr/film-" # 20 citations par page
# Valeur par defaut
ids_movie = [13, 14, 15, 29, 37, 67, 68, 228, 282, 452, 477, 577, 588, 597, 862, 891, 993, 997, 1183, 1270, 1325, 1486, 1691, 1868, 1935, 2029, 2030, 2031, 2032, 2088, 2143, 2225, 2505, 2617, 2995, 3248]
quote_list = [] # liste de toutes les citations
character_list = [] # liste de tous les personnages de chaque citation
ids_list = [] # liste de tous les ids de chaque citation
remove_ids_list = [] # liste pour supprimer des films dans la base de donnée