Skip to content

Case Study course for DS studies in Summer 2021/2022

Notifications You must be signed in to change notification settings

mini-pw/2022L-WB-data

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 

Repository files navigation

Warsztaty Badawcze - grupa 2022L-WB-data

@Hryniewska

Warszataty Badawcze składają się z:

  • wykładu
  • zajęć laboratoryjnych i projektowych

Terminy i tematy zajęć

Zajęcia będą składały się z dwóch części. Pierwsza z nich będzie skupiona na dogłębnej analizie danych medycznych: obrazowych, tabelarycznych oraz tekstowych. Po analizie dane zostaną przygotowane do drugiej części zajęć, czyli do trenowania nimi modeli uczenia maszynowego oraz gotowych architektur głębokich sieci neuronowych (możliwość wyboru między danymi obrazowymi a tekstowymi).

ZAJĘCIA DATA LABORATORIUM + PROJEKT PUNKTY
1 24-02-2022 Organizacja pracy. Jak będzie wyglądał projekt, nad czym będziemy pracować i jaki będzie efekt końcowy. Zapoznanie z danymi medycznymi. Podział baz danych między grupy.
2 03-03-2022 Zapoznanie się z artykułami opisującymi bazy danych. Kamień milowy 1 (8 pkt)
3 10-03-2022 Rodzaje annotacji. Wstępna analiza baz danych.
4 17-03-2022 Omówienie wstępnej analizy danych. Kamień milowy 2 (12 pkt)
5 24-03-2022 Zapoznanie się ze innymi sposobami analizy danych na podstawie artykułów.
6 31-03-2022 Jak wartościowe są dane w bazie danych. Proces annotowania danych (występujące problemy i jak ich uniknąć) - burza mózgów. Wstęp do zagadnienia uczenia aktywnego.
7 07-04-2022 Porównanie baz danych z ich opisem w artykule Kamień milowy 3 (6 pkt)
8 14-04-2022 Dlaczego uspójnianie danych jest ważne. Techniki preprocessingu (danych numerycznych, obrazowych i tekstowych). Dyskusja nad tym, jak stworzyć narzędzie uniwersalne do uspójniania danych. Kamień milowy 4 (8 pkt)
9 21-04-2022 Przegląd zastosowań sztucznej inteligencji na danych medycznych. Omówienie struktury raportu.
10 28-04-2022 Co koniecznie trzeba wiedzieć o sieciach przed trenowaniem. Kamień milowy 5 (14 pkt)
11 05-05-2022 Tworzymy pierwszy model obrazowy - krótki wstęp do trenowania (PyTorch).
12 19-05-2022 Tworzymy pierwszy model tekstowy - krótki wstęp do trenowania (PyTorch).
13 26-05-2022 Trenujemy gotowe architektury modeli naszymi danymi. Konsultacje prezentacji.
14 02-06-2022 Konsultacje projektowe.
15 09-06-2022 Podsumowanie projektów.

Prace domowe - kamienie milowe projektu

W pierwszej części każdy student będzie analizował dwie bazy danych - jedną z zaproponowanych przez prowadzącego, a jedną znalezioną samemu. Pierwsza praca domowa będzie wykonaną samodzielnie analizą bazy danych, bez wcześniejszych wytycznych. Kolejna praca domowa będzie obejmowała systematyczną, dogłębną analizę danych, której efekty zostaną zaprezentowane zbiorczo dla całego zespołu. Praca domowa nr 3 to porównanie bazy baz danych z tym, co jest napisane o nich w artykułach, zazwyczaj dołączanych do baz danych (w przypadku braku artykułu dotyczącego bezprośrednio bazy danych, trzeba będzie dotrzeć do artykułów, które wykorzystały tę bazę danych do treningu).

Następnie przechodzimy już do części drugiej przedmiotu, w której pierwszym zadaniem będzie przygotowanie bazy danych do późniejszego treningu. Ostatnie zadanie będzie polegało wytrenowaniu na przygotowanych danych dwóch modeli - do wyboru między modelami na danych tabelarycznych, obrazowych lub tekstowych. W przypadku wyboru modelu na danych tabelarycznych trzeba będzie samemu napisać kod i przeprowadzić uczenie. W przypadku danych obrazowych i tekstowych jak najbardziej można wziąć już istniejący kod, jedyną uwagą jest to, że raczej nie powinien to być kod wykorzystywany do trenowania na tej samej bazie danych, którą analizowaliśmy (ale jestem otwarta na dyskusje w tym temacie).

Zasady oceniania (suma 100 pkt)

  • praca na laboratoriach - 48 pkt.
  • nagrana prezentacja w LaTeX- 16 pkt. (oceniana przez wszystkich prowadzących)
    • dwie prezentacje z grupy zajęciowej, które uzyskały najlepsze oceny, zostaną zaprezentowane wszystkim studentom
  • raport końcowy w LaTeX, z którego powstanie książka - 32 pkt.
  • stosowanie dobrych praktyk używania Gita - 4 pkt.

Terminy

  • oddanie prezentacji 29.05.2022
  • oddanie raportu końcowego 09.06.2022

Prefiksy do raport końcowego

7_1_ dla zespołu Andrzejczuk_Bielecki_Wolny
7_2_ dla zespołu Deręgowski_Gryszkiewicz_Okonek
7_3_ dla zespołu Flis_Modzelewski_Olender
7_4_ dla zespołu Gąska_Fołtyn_Rakus
7_5_ dla zespołu Grunas_Sinski_Pawlikowski

Literatura

About

Case Study course for DS studies in Summer 2021/2022

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published