From 095c828591b429752ad0ab6f10e339316e5b2a1b Mon Sep 17 00:00:00 2001 From: nixiieee <100034412+nixiieee@users.noreply.github.com> Date: Wed, 14 Jun 2023 23:52:36 +0300 Subject: [PATCH] Update README.md --- README.md | 11 ++++++----- 1 file changed, 6 insertions(+), 5 deletions(-) diff --git a/README.md b/README.md index 38c3f88..4d02adc 100644 --- a/README.md +++ b/README.md @@ -10,11 +10,12 @@ LLM_train - ноутбуки для перевода англоязычного датасета и дальнейшего обучения на нём языковой модели-декодера. datasets - всё, что использовалалось для подготовки данных для модели: - 1. clipscore_quality_test - ручной тест качества метрики clipscore и переводчика. - 2. coco_translation - перевод caption'ов COCO-2014. - 3. flan_translation - перевод CoT части FLAN'a с английского на русский. - 4. load_data - загрузка изображений из url'ов датасета Wiki и скачивание COCO-2014 - 5. wikitext_normalization - нормализация и предобработка caption'ов Wiki датасета и подсчет CLIP score его и COCO. + +1. clipscore_quality_test - ручной тест качества метрики clipscore и переводчика. +2. coco_translation - перевод caption'ов COCO-2014. +3. flan_translation - перевод CoT части FLAN'a с английского на русский. +4. load_data - загрузка изображений из url'ов датасета Wiki и скачивание COCO-2014 +5. wikitext_normalization - нормализация и предобработка caption'ов Wiki датасета и подсчет CLIP score его и COCO. experiments - все предыдущие эксперименты с моделью и её производными