Этот код представляет собой пример анализатора текста для определения спама в сообщениях с использованием метода опорных векторов (SVM) и векторизации TF-IDF.
- Загрузите необходимые библиотеки и корпус стоп-слов.
- Очистите текст от пунктуации, приведите к нижнему регистру и проведите стемминг.
- Разделите данные на обучающий и тестовый наборы.
- Примените TF-IDF для векторизации текста.
- Обучите модель SVM с линейным ядром.
- Получите прогнозы для тестового набора.
- Выведите матрицу ошибок, отчет о классификации и точность модели.
- Используйте библиотеку ipywidgets для создания интерфейса.
- Создайте функцию
analyze_text
, которая принимает текст, векторизует его и делает прогноз с помощью обученной модели. - Создайте кнопки для запуска анализа и очистки ввода.
- Отобразите текстовое поле для ввода, кнопки и текстовое поле для вывода результата.
Этот код позволяет вам интерактивно проверять сообщения на наличие спама, используя обученную модель SVM.