Skip to content

VicDik/edusummer2021

 
 

Repository files navigation

Edu Summer 2021

Концепция

Мы стартуем с трех треков:

  1. Трек эволюционной биологии, чтение Кунина - одна глава в неделю с обсуждением всего, чтобы не осталось неясностей - это вас прокачает в генетике и геномике до уровне аспиранта к зиме.
  2. Трек алгоритмов как в яндекс пратике (там это факультатив), и уже есть план задачек на полгода на codewars, набить руку + codegame - набить скилл бегло писать код не задумываясь.
  3. Трек прикладной биоинформатики - уметь запускать основные тулы и знать куда какой применять и когда. И пройти наконец-то розалинд.

Подготовительные треки:

  1. Базовый питон и линукс, трек для подготовки к основному треку (предположительный старт 28го июня 2021).
  2. Введение в генетику, подготовка к экзамену по генетике в аспирантуру (предположительный старт 28го июня 2021).

Предполагаемые треки:

  1. Трек микробиологии - чтения Брука.
  2. Трек молекулярной биологии и генетики - чтение Генов по Льюину.

Возможно треков станет больше, но пока так.

Это прокачка подразумевает больше одной итерации, на первой вы учитесь, но второй учите осенью, после этого у вас навык будет закреплен. Плюс нам нужен пул ревьюеров, чтобы это можно было масштабировать. Плюс у всего этого мета с менеджментом стресса. Чего у нас не было в предыдущих попытках. Нам нужно найти тот вариант, который позволяет тем кто учиться не сломаться, а тем кто учит не выгореть.

Старт ближайщего потока (#поток2)

Мы спланируем стартовать второй поток 28 июня 2021. Уже с учетом ошибок первого потока.

Как присоединиться

Для того чтобы присоединиться, нужно решить первую неделю, сделать форк и пул реквест решения.

Старт нового потока каждые две недели.

Slack канал: https://join.slack.com/t/edusummer2021/shared_invite/zt-rgjeit11-yOjHrZNpi_92IMWXEmHS6w

Прогресс первого потока, второй спринт 14.06-05.07.2021

Student Rosalind Koonin Applied Coding Codewars Yandex Total
Maximal 55 20 90 66 -- 231
ochkalova 0 20 0 0 0 20
Chaotic-algorithm 0 0 0 0 0 0
sofya-d 0 0 0 0 0 0
Nadya7n 0 0 0 0 0 0
lavrentiy-danilov 0 0 0 66 0 66
Abusagit 55 20 50 66 0 191
iuliiasavina 0 0 0 0 0 0

Результаты первого потока, первый спринтv 31.05-13.06.2021

Student Rosalind Codewar Score Codewar solved Status Review Comments Кунин
ochkalova 6 52 10 PASS 0 1/1
tniapp 22 54 10 NOPE 9 0/1
KoptelovaEkaterina 6 4 1 NOPE 7 0/1
Chaotic-algorithm 16 63 11 PASS 32 1/1
Adeliia-K 6 2 1 NOPE 0 0/1
sofya-d 6 54 10 PASS 38 1/1
Nadya7n 6 56 11 PASS 39 1/1
lavrentiy-danilov 15 54 10 PASS 36 1/1
Abusagit 22 82 15 PASS 33 1/1
iuliiasavina 6 4 1 PASS 21 1/1

Условия прохождения этого спринта:

  1. Решить 6 задачек на розалинде.
  2. Решить 10 задачек на codewars.
  3. Сделать файл с терминами по первой главе Кунина.

Краткий план на этот месяц для первого потока

Спринт1 07-28.06.2021

  1. Введение в гит с использование браузера.
  2. Регистрация на сайтах, которые будем использовать.
  3. Решаем простенькие задачи с codewars.
  4. Решаем базовый питон с Rozalind.
  5. Решаем и смотрим вводные лекции от яндекса для школьников.
  6. Читаем первую главу Кунина.

Спринт2 21-27.06.2021

  1. Биологические форматы данных.
  2. Работа с табличными файлами.
  3. Пишем свой парсер фасты.
  4. Пишем свой парсер gbff (со зведочкой).
  5. Вторая глава Кунина.
  6. Начинаем штурмовать биологическую часть Розалинда.
  7. Начинаем пробовать писать сортировки.

Спринт3

  1. Работа с сырыми данными Иллюмины. Оценка качества, профайлы кмеров.
  2. Пишем свой визуализатор профиля кмеров и предсказания размера генома.
  3. Третья глава Кунина.
  4. Продолжаем штурмовать биологическую часть Розалинда.
  5. Решаем задачки на сортировку.

Спринт4

  1. Сборка бактериального генома. Какие есть ассемблеры.
  2. Основные подходы к сборке геномов.
  3. Пишем наивный сборщик генома короновируса de novo.
  4. Пишем наивный сборщик генома микоплазмы (со звездочкой).
  5. Начинаем штурмовать алгоритмическую часть Розалинда.
  6. Четвертая глава Кунина.
  7. TBA

План на ближайщую неделю (05-12.07.2021)

На этой неделе вам не нужно ничего кроме браузера.

Оформление гитхаба (21 points)

У вас должно быть:

  1. Аватарка с вашей фоткой.
  2. Короткое саммари о вас. Это можно вместе напридумывать.
  3. Компания: ITMO или aglab, если вы из другого вуза, то ваш ВУЗ или место работы
  4. Ваш личный емейл.
  5. Ссылку на сколар, если есть статьи в нем.
  6. Ссылки на соц сети по желанию.

В организция внизу у вас должен быть бейдж aglabx.

Кратенькое введение в гитхаб

Вот тут кратенькая инструкция.

Еще будет не раз про то, как это все завести и научиться использовать. Форк-пул-пулреквест-ревью-мердж-пул и тд.

Оформление репозитория для сдачи и проверки заданий (35 points)

Сделайте у себя форк этой репозитории. Ваша рабочая папка будет edusummer2021/students/<username>. Внутри следующая структура:

edusummer2021/students/<username>/playground - тут будет код наших проектов по биоиформатике.

edusummer2021/students/<username>/koonin - конспект Кунина и задачки по нему.

edusummer2021/students/<username>/basic_algo - решения задачек яндекса.

edusummer2021/students/<username>/codewars - решения задачек codewars и маркдаун файл с ссылками на ваши решения.

edusummer2021/students/<username>/codingame - решения задачек codingame и маркдаун файл с ссылками на ваши решения.

edusummer2021/students/<username>/rosalind - решения задачек rosalind.

edusummer2021/students/<username>/*.md - ваши конспекты и читшиты по разным темам.

Регистрация на codewars (20 points)

Нужно зарегистрироваться на codewars.com. В настройка прописать Clan aglabx. Лучше всего под вашим именем. Мой аккаунт https://www.codewars.com/users/ad3002. Опять же лучше фотку реальную.

Задачки на эту неделю без каких либо ограничений на алгоритмы, просто поиграться с платформой:

На разогреться и освоить платформу (7 и 8 ку):

  1. Opposite number
  2. Even or Odd
  3. Vowel Count
  4. Disemvowel Trolls
  5. Get the Middle Character
  6. All Star Code Challenge #1

Посложней (6 и 7 ку):

  1. Who likes it?
  2. Array.diff
  3. All Star Code Challenge #22

После решения будет возможность прислать ссылку на решение, его можно сслать всем, так как до того как ты сам решишь, чужие решения не видны.

Регистрация на codingame (20 points)

Нужно зарегистрироваться на https://www.codingame.com/. Страну, компанию и универ прописать как у меня в профайле. Опять же лучше фотку реальную.

На данном этапе нам нужны clash of code, остальные части платформы для вас пока будут очень сложными. Пока приватные, чтобы уровень был один.

Первая глава Кунина (страницы 1-19) (40 points)

На первом проходе вы читаете и выписываете все термины и ключевых персонажей. Да, его невозможно с одного прохода прочитать, особенно первую главу. Если совсем не врубаетесь, то лезете в англиийскую википедию. Если совсем плохо, то обсуждем уже очно. Для очного обсуждения нужно оставить то, что не удается понять самому. А там такое встречается. Рекомендумое чтение разбить на четыре подохода, там четыре логические части, и после каждого прочитать статьи в википедии.

В результате вы должны на пальцах объяснять, что значит каждый термин, пока без математики и алгоритмов.

Термины нужно разбить на триу группы:

  1. Ясно и могу объяснить.
  2. Вроде ясно, но не уверен, что смогу объяснить своими словами.
  3. Не ясно, нужна помощь с пониманием.

Кроме терминов, еще нужно придумать три вопроса, которых еще нет в списке уже придуманных вопросов, который будет обнавлятся по мере продвижения.

Не откладывайте Кунина, он сложней, чем может показываться.

Ожидается файл: "koonin/chapter1.md"

Регистрация на Rosalind (30 points)

Зарегистрироваться на rosalind. Регистрируйтесь через гитхаб или гмейл, ну или как нравится. И пройти Python Village - это должно вам очень просто. Мой аккаунт вот.

Задачки:

  1. Installing Python
  2. Variables and Some Arithmetic
  3. Strings and Lists
  4. Conditions and Loops
  5. Working with Files
  6. Dictionaries

Решение алгоритмов (со звездочкой) (200 points)

Зарегистрироваться на интро от яндекса там очень на пальцах про базовые концепции алгоритмов. От вас ожидается решенная первая домашка и первая лекция.

Лекция 1

Задачки 1

Что нужно делать? (14 points)

  1. Везде зарегаться и заполнить профайлы.
  2. Добавиться в группу телеграма https://t.me/joinchat/JUSW8DXeS4phNTcy, и кратко написать о себе там.
  3. Посмотреть инструкцию к гитхабу.
  4. Сделать форк этой репозитории к себе.
  5. Сделать новую ветку с именем week1 и перейти в эту ветку.
  6. В этой ветке сделать файл ./students/<your_username>/about.md.
  7. Заполнить этот файл нужными ссылками.
  8. Сделать pull request из your_name/edusummer2021:week1 в aglabx/edusummer2021:main (это же можно назвать отправить на проверку и ревью).
  9. Созать файл: ./students/<your_username>/codewars/week1_solutions.md.
  10. Созать файл: ./students/<your_username>/rosalind/week1_solutions.md.
  11. Решить задачки на codewars и поместить ссылки на решения в файл ./students/<your_username>/codewars/week1_solutions.md.
  12. Решить задачки из Розалинда и поместить ссылки на решения в файл ./students/<your_username>/rosalind/week1_solutions.md.
  13. Решить задачки из Яндекса и поместить ссылки на решения в файл ./students/<your_username>/yandex/week1_solutions.md.
  14. Создать файл для со всеми терминами из первой главы Кунина ./students/<your_username>/kunin/chapter1.md, терпины разбить на три группы: понятно, не уверен, точно не понятно.

В результате я ожидаю увидить что-то вот такое:

image

Как сдать задачки

Для каждого типа задачек у вас есть файл week1_solutions.md, например, для codewars он будет лежать в ./students/<your_username>/codewars/week1_solutions.md в ветке week1.

Для каждого типа задачек у вас есть файл week1_solutions.md, например, для codewars он будет лежать в ./students/<your_username>/codewars/week2_solutions.md в ветке week2.

Это файл нужно открыть в гитхаб и нажать кнопку редактировть, после этого в нем прописать ваши решения вот с таким синтаксисом

# 3. Vowel count https://www.codewars.com/kata/54ff3102c1bad923760001f3

```python
def get_count(input_str):
    num_vowels = 0
    num_vowels += input_str.count('a')
    num_vowels += input_str.count('e')
    num_vowels += input_str.count('i')
    num_vowels += input_str.count('o')
    num_vowels += input_str.count('u')
    return num_vowels
```

# 6. Get the Middle Character https://www.codewars.com/kata/5863f97fb3a675d9a700003f/python

```python
def sum_ppg(playerOne, playerTwo):
    ppg_1 = playerOne['ppg']
    ppg_2 = playerTwo['ppg']
    return ppg_1 + ppg_2
```
  1. ## - означает заголовок второго уровня
  2. [текст линка](ссылка) - так оформляются ссылки
  3. ```python - начала блока питона, дальще можно вставить код питона
  4. ``` - окончания кода питона

Подготовка данных к формальной проверке

Для того, чтобы автоматизировать проверку заданий, задания должны быть оформлены стандартным способом.

На примере первой недели:

  1. Путь к файлу должен быть вида edusummer2021/students/<your gtihub name>/codewars/week1_solutions.md
  2. Файлы должны быть у правильное ветке week1 или week2 и тд.

Markdown файл должен быть следующего вида

  
# 1. Opposite Number. https://www.codewars.com/kata/56dec885c54a926dcd001095

```python
def opposite(number):
    return -1 * number
```
  
# 2. Even or Odd. https://www.codewars.com/kata/53da3dbb4a5168369a0000fe/train/python

```python
def even_or_odd(number):
    return "Odd" if number % 2 else "Even"
```

Хедер начинается с решетки. Потом номер задания, потом точка, потом имя задания, потом точка, внутри имени задания других точек не должно быть. Потом ссылка на ваше решение, если такая ссылка еть.

После этого пустая строка.

Потом три лапки слово python. Внутри код. Обратите внимание на отступы, один отступ - это четыре пробела, никаких табов. Потом три лапки.

После этого пустая строка.

После этого следущее решение.

Без такого форматирование задание автоматически не примется.

Общий таймлайн, дедлайны и другие организационные штуки

Таймлайн калька с Яндекс Практики с небольшими адаптациями.

Один цикл две недели. Первая неделя заканчивается софт дедлайном, вторая неделя заканчивается хард дедлайном. Чтобы идти с потоком, то на момент софт дедлайна нужно заслать решение и сдать его не поздней хард.

Следующие недели в приватном репозитории будут.

В случае незакрытия хард дедлайна, вы уходите в академ, и можете восстановиться на следующем потоке на этой же неделе, где не справились.

В академ можно уходить три раза.

Сейчас планирутся старт потока по мере его формирования.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%