Über den Kurs
-Willkommen zu unserem Kurs! Hier lernen Sie die Grundlagen der computergestützten Verarbeitung natürlicher Sprache (NLP) und deren praktische Anwendung kennen. Sie werden mit den digitalisierten Zeitungsbeständen der Deutschen Digitalen Bibliothek arbeiten und sich auf den Themenschwerpunkt "Natur- und Umweltkatastrophen in Medien" konzentrieren.
- -Nach dem Kurs können Sie:
- --
-
- Wesentliche Python-Pakete für NLP-Aufgaben an eigenen Daten anwenden -
- Große Datensätze für die weitere Analyse vorbereiten -
- Transformer-Modelle und Large Language Models für NLP-Aufgaben mit großen Datenmengen einsetzen -
- Die Anwendung verschiedener NLP-Methoden kritisch reflektieren -
- Ihre Forschungsergebnisse in einem wissenschaftlichen Paper verarbeiten -
Kursplan
-Termin 1: 25. Oktober 2024 (10:00 Uhr bis 11:30 Uhr)
--
-
- Einführung in das Thema, in den Kurs und NLP -
- Crash Kurs Python 1 -
Termin 2: 08. November 2024 (10:00 Uhr bis 11:30 Uhr)
--
-
- Crash Kurs Python 2/Einführung Colab Notebooks -
- Einführung in NLP mit SpaCy -
Termin 3: 22. November 2024 (10:00 Uhr bis 11:30 Uhr)
--
-
- Das Deutsche Zeitungsportal: Einführung und API-Nutzung -
- (Gäste: Lisa Landes und Michael Büchner von der Deutschen Digitalen Bibliothek) -
Termin 4: 06. Dezember 2024 (10:00 Uhr bis 11:30 Uhr)
--
-
- Aktuelle Fortschritte im NLP: Transformer-Modelle -
- NLP für die semantische Suche und Textähnlichkeit (Word Embeddings) -
Termin 5: 20. Dezember 2024 (10:00 Uhr bis 11:30 Uhr)
--
-
- Aktuelle Fortschritte im NLP: große Sprachmodelle (LLMs) -
- NLP und Textverarbeitungstechniken für Dokumentenanalyse:
-
-
-
- Semantische Extraktion (Artikelsegmentierung) -
- Post-OCR-Korrektur -
-
Termin 6: 10. Januar 2025 (10:00 Uhr bis 11:30 Uhr)
--
-
- NLP für Entitätenextrahierung (Named Entity Recognition/NER) -
- NLP für Textklassifizierung -
Termin 7: 24. Januar 2025 (10:00 Uhr bis 11:30 Uhr)
--
-
- Individuelle Besprechungstermine -