Ein Data Management Projekt im Rahmen des Online-Masters "Biomedizinische Informatik und Data Science" an der Hochschule Mannheim.
Dieses GitHub-Repository enthält den Code und die Dokumentation für das Data Management Projekt "PRECISE-BC". Ziel des Projekts ist die Datenaufbereitung, -verarbeitung und Analyse von synthetischen Patientendaten, die mit Synthea TM generiert wurden. Das Hauptaugenmerk liegt auf der Auswirkung von Komorbiditäten auf die Lebensqualität von Brustkrebspatientinnen und -patienten.
Das Projekt simuliert und erarbeitet alle Prozesse eines Datenmanagement-Projekts:
- Erstellen des Datenmanagementplan der Projektoutline und Studienziele sowie Datenschutzfolgeabschätzung
- Erstellung der Quelldatenbank mittels Rohdaten/ Quelldaten
- Überführen der Daten in ein Data Warehouse, (ETL-Prozess)
- Erarbeitung eines statistischen Analyse Plans sowie Analyse und Visualisierung der Daten gemäss der selbst gewählten Forschungsfrage
Wie beeinflussen Komorbiditäten die Lebensqualität von Brustkrebspatientinnen und -patienten?
- Datenmanagement: Erstellung eines Datenmanagementplans, Durchführung einer Datenschutz-Folgenabschätzung.
- Quelldatenbank: Quelldaten wurden mithilfe eines Google Colab Notebooks in die Quelldatenbank geladen.
- ETL-Prozess: Daten wurden aus der Quelldatenbank extrahiert, transformiert und in ein Data Warehouse geladen.
- Datenanalyse: Durchführung einer explorativen Datenanalyse und experimenteller Machine Learning Ansätze.
- Archivierung: Veröffentlichung des Projekts als Release im GitHub Repository und Archivierung auf Zenodo.
Die Analyseergebnisse und erstellten Plots sind im GitHub Wiki dokumentiert.
Die Skripte wurden in Python und SQLite erstellt, mit Google Colab als Entwicklungsumgebung. Alle Informationen zur Systemumgebung sind im [Wiki - Systemumgebung) dokumentiert.
Um die Projektausführung nachzuvollziehen, führen Sie die Notebooks in der angegebenen Reihenfolge online in Google Colab oder lokal auf Ihrem Rechner aus:
Viel Erfolg bei der Exploration unseres Projekts! Bei Fragen stehen wir gerne zur Verfügung.