Die in dieser Arbeit vorgestellte Methodik zeigt, wie flüchtige Quellen und anonyme Autor*innengruppen im Rahmen einer strukturierten, digital-historischen Quellenkritik analysiert werden können. Bei der Bewertung der Validität der untersuchten Quellen im Kontext der äußeren Quellenkritik hat sich die Orientierung an den die digitalen Quellen erzeugenden Prozessen als zielführend erwiesen. In Anlehnung an Methoden aus der Softwareentwicklung und Qualitätssicherung konnten fundierte Aussagen über die Validität von genuin digitalen Quellen getroffen werden. So konnte durch die Identifikation der an der Erzeugung der Benutzerbeiträge und Artikelhistorien beteiligten Programmteile spezifisch nach gemeldeten oder bereits behobenen Fehlern im öffentlich zugänglichen Bugtracking-System gesucht werden. Die Überprüfung im Rahmen des Fallbeispiels lies darauf schließen, dass die verantwortlichen Programmteile fehlerfrei und die zu untersuchenden Daten somit keine Abweichungen vom erwarteten Zustand aufweisen. Weiterhin vermittelte die technische Analyse der zugrunde liegenden Software einen tieferen Einblick in die Datenstrukturen und führte somit zu einem besseren Verständnis des Quellengegenstandes.
Diese grundsätzlich prozesskritische Haltung sollte jedoch nicht nur auf genuin digitale Quellenbestände angewandt werden. Auch Retrodigitalisate sind zwangsläufig das Ergebnis von digitalen Verarbeitungsprozessen. Die kritische Analyse der dabei eingesetzten Technologien könnte dabei helfen, Probleme wie den Xerox-Bug frühzeitig identifizieren zu können. 1 Diese Herangehensweise ist prinzipiell auf jedes informationstechnische System übertragbar, jedoch variiert der Aufwand und die Komplexität je nach System enorm. Transparente Systeme im Sinne von Open Source erscheinen hierbei weitaus forschungsfreundlicher als proprietäre Systeme.
Das Problem der Autorenkritik einer anonymen Autor*innengruppen in einem kollaborativem System konnte im gleichen Maße durch die Analyse der zugrunde liegenden Relationen zwischen Autor*innen und Schreibakten in Form von Artikelversionen gelöst werden. Durch die sprachübergreifende Erhebung der Schreibakte eines Users können rudimentäre Profile auf Grundlage der benutzten Sprachversionen erstellt und der User in einem gewichteten Netzwerk aus Sprach- und Artikelversionen eingeordnet werden. Dieses Vorgehen umgeht das Problem der Anonymität durch die Darstellung der tatsächlichen Beteiligung am kooperativen Prozess. Durch die Visualisierung bestimmter Autor*innengruppen über die Auswahl spezifischer Artikelabschnitte lässt sich die Entwicklung der Autorschaft eines Artikels zu verschiedenen Zeitpunkten in dessen Chronologie bewerten. Weiterhin erlaubt der Vergleich der Autor*innengruppen verschiedener Artikel Schnittmengen zwischen diesen Gruppen bzw. deren Abwesenheit zu ermitteln. Aus diesen Untersuchungen lassen sich Schlussfolgerungen zum sich verändernden Einfluss verschiedener Gruppen auf einzelne Artikel ziehen. Schließlich konnte über die Kleingruppenanalyse gezeigt werden, dass auch individuelle Akteure oder kleine Gruppen von Akteuren unabhängig von Artikelhistorien auf deren Wirken untersucht werden können. Am vorliegenden Beispiel konnte eine Beteiligung chinesischer Autor*innen am englischen Artikel der Tiananmenplatz-Proteste zu den Jahrestagen 2009, 2019 und 2020 ausgeschlossen werden. Weiterhin wurde durch die Akteursanalyse ein auffällig hoher Anteil international agierender Autor*innen kurz vor der Sperrung der chinesischen Wikipedia innerhalb der Volksrepublik China identifiziert. Dieser zeitweilige Anstieg des internationalen Einflusses könnte dabei ein wichtiger Faktor für die Sperrung selbst gewesen sein. Diese aus der Quellenkritik hervorgegangenen Befunde wären in einer anschließenden Untersuchung des Quelleninhaltes zu überprüfen.
Gleichwohl ist zu vermerken, dass die Wikipedia als beinahe idealtypischer Quellenkorpus betrachtet werden kann. Die lückenlose Nachvollziehbarkeit der Artikelversionen, der ungehinderte Zugriff auf die zu untersuchenden Daten sowie die Offenheit der zugrundeliegenden Software bieten eine bemerkenswerte Grundlage für die Anwendung der hier vorgestellten Methoden. Durch die Art der Datenerhebung über das Webinterface und die modulare Gestalt der entwickelten Software sollten die vorgestellten Ansätze jedoch auf eine Vielzahl unterschiedlicher genuin digitaler Quellenkorpora übertragbar sein.
Auch Abseits der eigentlichen Autorenkritik sowie historischen Forschung könnten derartige Akteursanalysen hilfreiche Werkzeuge sein. So könnten von den vorgestellten Analysemöglichkeiten auch Methoden zur Identifikation von Manipulationsversuchen abgeleitet werden. Weiterhin ist durch die Ausweitung der Kleingruppenanalyse die Visualisierung komplexer Autor*innennetzwerke über eine Vielzahl von Artikeln und Sprachversionen möglich. Schließlich könnten auch andere Arten der Visualisierung die Auswertung der erhobenen Datensätze bereichern. So könnte die Darstellung der Sprachverteilung eines Artikels in regelmäßigen Zeitabschnitten in einem Balkendiagramm der Identifikation von Änderungen in der Zusammensetzung der Autor*innengruppe zuträglich sein. Die gewählte Darstellung und Auswertung der Autor*innengruppen mittels Netzwerkanalysen ist somit nur als erster Schritt in der Analyse der erhobenen Datensätze zu verstehen.
Footnotes
-
David Kriesel identifizierte 2013 einen Fehler in der Bildkompression der weit verbreiteten Xerox-Kopierer, die zu fehlerhaften Ziffernangaben in den digitalisierten Dokumenten führte. Siehe Kriesel, David: Xerox-Scankopierer verändern geschriebene Zahlen, 05.09.2017, http://www.dkriesel.com/blog/2013/0802_xerox-workcentres_are_switching_written_numbers_when_scanning, Stand: 18.09.2020. ↩