From 095c828591b429752ad0ab6f10e339316e5b2a1b Mon Sep 17 00:00:00 2001
From: nixiieee <100034412+nixiieee@users.noreply.github.com>
Date: Wed, 14 Jun 2023 23:52:36 +0300
Subject: [PATCH] Update README.md
---
README.md | 11 ++++++-----
1 file changed, 6 insertions(+), 5 deletions(-)
diff --git a/README.md b/README.md
index 38c3f88..4d02adc 100644
--- a/README.md
+++ b/README.md
@@ -10,11 +10,12 @@
LLM_train
- ноутбуки для перевода англоязычного датасета и дальнейшего обучения на нём языковой модели-декодера.
datasets
- всё, что использовалалось для подготовки данных для модели:
- 1. clipscore_quality_test
- ручной тест качества метрики clipscore и переводчика.
- 2. coco_translation
- перевод caption'ов COCO-2014.
- 3. flan_translation
- перевод CoT части FLAN'a с английского на русский.
- 4. load_data
- загрузка изображений из url'ов датасета Wiki и скачивание COCO-2014
- 5. wikitext_normalization
- нормализация и предобработка caption'ов Wiki датасета и подсчет CLIP score его и COCO.
+
+1. clipscore_quality_test
- ручной тест качества метрики clipscore и переводчика.
+2. coco_translation
- перевод caption'ов COCO-2014.
+3. flan_translation
- перевод CoT части FLAN'a с английского на русский.
+4. load_data
- загрузка изображений из url'ов датасета Wiki и скачивание COCO-2014
+5. wikitext_normalization
- нормализация и предобработка caption'ов Wiki датасета и подсчет CLIP score его и COCO.
experiments
- все предыдущие эксперименты с моделью и её производными