Skip to content

Commit

Permalink
do not check names
Browse files Browse the repository at this point in the history
  • Loading branch information
borisikhin committed Dec 1, 2024
1 parent 2818276 commit 1c67832
Showing 1 changed file with 13 additions and 5 deletions.
18 changes: 13 additions & 5 deletions .github/scripts/spell_check.py
Original file line number Diff line number Diff line change
Expand Up @@ -2,6 +2,7 @@
import enchant
import re
import sys
import names # Используем библиотеку для распознавания имен

# Укажите папку с файлами для проверки
FILES_DIR = "./"
Expand All @@ -13,8 +14,8 @@
# Регулярное выражение для извлечения слов из текста
WORD_REGEX = re.compile(r'\b\w+\b', re.UNICODE)

# Регулярное выражение для обнаружения ссылок (URL)
URL_REGEX = re.compile(r'https?://\S+|www\.\S+', re.UNICODE)
# Регулярное выражение для обнаружения ссылок (URL) — улучшенное
URL_REGEX = re.compile(r'http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\\(\\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+', re.UNICODE)

# Инициализация словарей для английского и русского языков
en_dict = enchant.Dict("en_US")
Expand Down Expand Up @@ -58,18 +59,24 @@ def is_url(word):
"""
return bool(URL_REGEX.match(word))

def is_name(word):
"""
Проверяет, является ли слово вероятным именем.
"""
return names.get_first_name() == word # Простое сравнение с именем, можно улучшить

def check_spelling(file_path, exceptions):
"""
Проверяет орфографию в указанном файле, пропуская слова-исключения и ссылки.
Проверяет орфографию в указанном файле, пропуская слова-исключения, ссылки и имена.
"""
errors = []
with open(file_path, 'r', encoding='utf-8') as f:
lines = f.readlines()
for line_number, line in enumerate(lines, start=1):
words = WORD_REGEX.findall(line)
for word in words:
# Пропускаем ссылки и слова-исключения
if is_url(word) or word in exceptions:
# Пропускаем ссылки, имена и слова-исключения
if is_url(word) or is_name(word) or word in exceptions:
continue
if not (en_dict.check(word) or ru_dict.check(word)):
errors.append((line_number, word))
Expand Down Expand Up @@ -107,6 +114,7 @@ def main():
error_found = True
print()


# Если найдены ошибки, завершить с кодом 1
if error_found:
print("Spell check found errors. Exiting with failure.")
Expand Down

0 comments on commit 1c67832

Please sign in to comment.