Informationen zum Korpus historischer Patiententexte (CoPaDocs)

Verwaltungsgebäude der Heil- und Pflegeanstalt Kaufbeuren, um 1920; Archiv des Bezirkskrankenhauses Kaufbeuren

Der Hauptfokus des Korpus historischer Patiententexte (CoPaDocs) liegt auf Material aus der 1849 gegründeten psychiatrischen Einrichtung in Kaufbeuren-Irsee in Bayerisch-Schwaben (Nachfolgeinstitution: Bezirkskrankenhaus Kaufbeuren; siehe Wikipedia). Von dort wurden im Laufe der zehnjährigen Arbeit an den Quellen über 3.300 Patiententexte des 19. und frühen 20. Jahrhunderts bearbeitet. Dazu kommen etwa 500 Texte aus sieben westfälischen psychiatrischen Einrichtungen, die Christina Eichhorn-Hartmeyer im Rahmen ihres Promotionsprojekts im LWL-Archivamt für Westfalen, Münster erhoben hat. Diese stammen aus Dortmund-Aplerbeck, Gütersloh, Lengerich-Bethesda, Lippstadt-Eickelborn, Marsberg, Münster-Marienthal und Warstein. Auch aus Hamburg-Langenhorn (Staatsarchiv Hamburg) konnten etwa 150 Patiententexts ins Korpus aufgenommen werden.

Alle Texte des Korpus wurden manuell transkribiert und anschließend mindestens einmal von einer zweiten, im Lesen der Kurrentschrift besonders erfahrenen Person Korrektur gelesen. Schwierige Texte erhielten ggf. weitere Korrekturdurchgänge. Die Bearbeiter der Dokumente werden namentlich in den Metadaten jeder Datei genannt. Die Transkription erfolgte handschriftennah, d. h. es wurden keinerlei Normalisierungen durchgeführt. Unleserliche Stellen und unsichere Lesarten wurden dabei klar markiert (siehe dazu die Kodierung).

Das Korpus wurde nach den internationalen Standards im XML-Format TEI P5 erstellt. Grundlegende Strukturen der Textauszeichnung wie Durchstreichungen und Hinzufügungen wurden dabei annotiert. Zu jedem Brief werden auch Faksimiles veröffentlicht, was einerseits die Nachprüfbarkeit der erstellten Transkriptionen ermöglicht, andererseits auch einen originalgetreuen Eindruck vom überlieferten Text vermittelt, wie ihn eine Transkription bzw. Edition nie darstellen kann. Linguistische Annotationen konnten im Rahmen des oben beschriebenen Forschungsprojekts nicht durchgeführt werden, sind aber durch die automatische Annotation mit besonderem Fokus auf historische Schreibweisen im DWDS-Korpus Patiententexte abfragbar. Momentan enthält das Korpus 3.943 Texte mit insgesamt ca. 1,8 Millionen Wörtern.

Links: Archiv des Bezirkskrankenhauses Kaufbeuren (Umräumaktion 2013); rechts: Oxygen XML-Editor

Sukzessive soll das Korpus durch Texte aus dem restlichen deutschsprachigen Raum erweitert werden. Stichprobenartige Erhebungen wurden etwa von Franziska Eber-Hammerl im Archiv des niederbayerischen Bezirksklinikums Mainkofen durchgeführt; auch aus den psychiatrischen Einrichtungen in Erlangen und Ansbach liegen uns kleinere Sammlungen noch unveröffentlichter Patiententexte vor. In einem weiterführenden Projekt sollen auch Patientenbriefe aus Großbritannien veröffentlicht werden, die im Zentrum der Dissertation von Julian Mader stehen.


Infos zur Technik, Tools und Nachnutzbarkeit …