Warszataty Badawcze składają się z:
- wykładu
- zajęć laboratoryjnych i projektowych
Zajęcia będą składały się z dwóch części. Pierwsza z nich będzie skupiona na dogłębnej analizie danych medycznych: obrazowych, tabelarycznych oraz tekstowych. Po analizie dane zostaną przygotowane do drugiej części zajęć, czyli do trenowania nimi modeli uczenia maszynowego oraz gotowych architektur głębokich sieci neuronowych (możliwość wyboru między danymi obrazowymi a tekstowymi).
ZAJĘCIA | DATA | LABORATORIUM + PROJEKT | PUNKTY |
---|---|---|---|
1 | 24-02-2022 | Organizacja pracy. Jak będzie wyglądał projekt, nad czym będziemy pracować i jaki będzie efekt końcowy. Zapoznanie z danymi medycznymi. Podział baz danych między grupy. | |
2 | 03-03-2022 | Zapoznanie się z artykułami opisującymi bazy danych. | Kamień milowy 1 (8 pkt) |
3 | 10-03-2022 | Rodzaje annotacji. Wstępna analiza baz danych. | |
4 | 17-03-2022 | Omówienie wstępnej analizy danych. | Kamień milowy 2 (12 pkt) |
5 | 24-03-2022 | Zapoznanie się ze innymi sposobami analizy danych na podstawie artykułów. | |
6 | 31-03-2022 | Jak wartościowe są dane w bazie danych. Proces annotowania danych (występujące problemy i jak ich uniknąć) - burza mózgów. Wstęp do zagadnienia uczenia aktywnego. | |
7 | 07-04-2022 | Porównanie baz danych z ich opisem w artykule | Kamień milowy 3 (6 pkt) |
8 | 14-04-2022 | Dlaczego uspójnianie danych jest ważne. Techniki preprocessingu (danych numerycznych, obrazowych i tekstowych). Dyskusja nad tym, jak stworzyć narzędzie uniwersalne do uspójniania danych. | Kamień milowy 4 (8 pkt) |
9 | 21-04-2022 | Przegląd zastosowań sztucznej inteligencji na danych medycznych. Omówienie struktury raportu. | |
10 | 28-04-2022 | Co koniecznie trzeba wiedzieć o sieciach przed trenowaniem. | Kamień milowy 5 (14 pkt) |
11 | 05-05-2022 | Tworzymy pierwszy model obrazowy - krótki wstęp do trenowania (PyTorch). | |
12 | 19-05-2022 | Tworzymy pierwszy model tekstowy - krótki wstęp do trenowania (PyTorch). | |
13 | 26-05-2022 | Trenujemy gotowe architektury modeli naszymi danymi. Konsultacje prezentacji. | |
14 | 02-06-2022 | Konsultacje projektowe. | |
15 | 09-06-2022 | Podsumowanie projektów. |
W pierwszej części każdy student będzie analizował dwie bazy danych - jedną z zaproponowanych przez prowadzącego, a jedną znalezioną samemu. Pierwsza praca domowa będzie wykonaną samodzielnie analizą bazy danych, bez wcześniejszych wytycznych. Kolejna praca domowa będzie obejmowała systematyczną, dogłębną analizę danych, której efekty zostaną zaprezentowane zbiorczo dla całego zespołu. Praca domowa nr 3 to porównanie bazy baz danych z tym, co jest napisane o nich w artykułach, zazwyczaj dołączanych do baz danych (w przypadku braku artykułu dotyczącego bezprośrednio bazy danych, trzeba będzie dotrzeć do artykułów, które wykorzystały tę bazę danych do treningu).
Następnie przechodzimy już do części drugiej przedmiotu, w której pierwszym zadaniem będzie przygotowanie bazy danych do późniejszego treningu. Ostatnie zadanie będzie polegało wytrenowaniu na przygotowanych danych dwóch modeli - do wyboru między modelami na danych tabelarycznych, obrazowych lub tekstowych. W przypadku wyboru modelu na danych tabelarycznych trzeba będzie samemu napisać kod i przeprowadzić uczenie. W przypadku danych obrazowych i tekstowych jak najbardziej można wziąć już istniejący kod, jedyną uwagą jest to, że raczej nie powinien to być kod wykorzystywany do trenowania na tej samej bazie danych, którą analizowaliśmy (ale jestem otwarta na dyskusje w tym temacie).
- praca na laboratoriach - 48 pkt.
- nagrana prezentacja w LaTeX- 16 pkt. (oceniana przez wszystkich prowadzących)
- dwie prezentacje z grupy zajęciowej, które uzyskały najlepsze oceny, zostaną zaprezentowane wszystkim studentom
- raport końcowy w LaTeX, z którego powstanie książka - 32 pkt.
- stosowanie dobrych praktyk używania Gita - 4 pkt.
- oddanie prezentacji 29.05.2022
- oddanie raportu końcowego 09.06.2022
7_1_ dla zespołu Andrzejczuk_Bielecki_Wolny
7_2_ dla zespołu Deręgowski_Gryszkiewicz_Okonek
7_3_ dla zespołu Flis_Modzelewski_Olender
7_4_ dla zespołu Gąska_Fołtyn_Rakus
7_5_ dla zespołu Grunas_Sinski_Pawlikowski
- Aston Zhang, Zachary C. Lipton. & Mu Li and Alexander J. Smola. (2021). Dive into Deep Learning.
- Weronika Hryniewska, Piotr Czarnecki, Jakub Wiśniewski, Przemysław Bombiński & Przemysław Biecek (2021) Prevention is better than cure: a case study of the abnormalities detection in the chest. CVPR 2021 Workshop "Beyond Fairness"
- Erdi Çallı, Ecem Sogancioglu, Bram van Ginneken, Kicky G.van Leeuwe & Keelin Murphy (2021) Deep learning for chest X-ray analysis: A survey. Medical Image Analysis
- Huazhu FU (2021) COVID-19 Imaging-based AI Research Collection
- Afshin Shoeibi et al. (2020) Automated Detection and Forecasting of COVID-19 using Deep Learning Techniques: A Review