Technik, Tools, Nachnutzbarkeit

Kodierung

Die Transkription der Handschriften im XML-Format TEI P5 folgt in großen Teilen dem Basisformat des Deutschen Textarchivs (DTABf). Neben den Metadaten im Kopf – <teiHeader> – werden im Textbereich – <text> – folgende Elemente benutzt:

Element Beschreibung Bemerkungen
add (nachträgliche) Hinzufügung
Attribut Beschreibung Werte
@hand Hand des Schreibenden entsprechender Wert aus /TEI/teiHeader/profileDesc/handNotes/handNote/@scribe
@place Ort der Hinzufügung
"above" intralineare Einfügung darüber
"below" interlineare Einfügung darunter
"bottom" Einfügung am unteren Seitenrand
"inline" Einfügung auf der Zeile
"margin" Einfügung am Rand
"opposite" Zusatz, der auf anderer Briefseite weitergeht
"top" Einfügung am oberen Seitenrand
body Textteil
dateline Datumszeile
del (nachträgliche) Tilgung
Attribut Beschreibung Werte
@hand Hand des Schreibenden entsprechender Wert aus /TEI/teiHeader/profileDesc/handNotes/handNote/@scribe
emph Hervorhebung
facsimile Faksimile
foreign fremdsprachliches Material
Attribut Beschreibung Werte
@xml:lang Sprache Sprachcode aus ISO 639-3
graphic Verweis auf Abbildung
Attribut Beschreibung Werte
@mimeType MIME-Typ der Bilddatei image/jpeg (andere Formate werden im Projekt nicht benutzt)
@url Ort der Bilddatei
@xml:id ID, wird für die Referenzierung in <pb facs="…"/> benutzt
handShift Wechsel des Schreibenden
Attribut Beschreibung Werte
@medium Schreibinstrument entsprechender Wert aus /TEI/teiHeader/profileDesc/handNotes/handNote/@medium
@scribe Hand des Schreibenden entsprechender Wert aus /TEI/teiHeader/profileDesc/handNotes/handNote/@scribe
hi typografische Hervorhebung
Attribut Beschreibung Werte
@hand nur in Verbindung mit @rendition="#u": Hand des Unterstreichenden entsprechender Wert aus /TEI/teiHeader/profileDesc/handNotes/handNote/@scribe
@rendition Textformatierung
#b fett
#c zentriert
#i lateinische Schrift
#r rechtsbündig
#sub tiefgestellt
#sup hochgestellt
#u unterstrichen
lb Umbruch am Zeilenende
Attribut Beschreibung Werte
@break Art des Umbruchs
"no" Umbruch mit Trennung im Wort
"yes" Umbruch zwischen Wörtern
milestone Textunterbrechung nur als abschnitttrennende horizontale Linie: <milestone rendition="#hr" unit="section"/>
opener Briefanfang
p Textabsatz
pb Seitenbeginn
Attribut Beschreibung Werte
@break Art des Umbruchs
"no" Seitenumbruch mit Trennung im Wort
"yes" Seitenumbruch zwischen Wörtern
@facs Verweis auf Faksimile entsprechendes Element aus /TEI/facsimile/graphic
placeName Ortsname
Attribut Beschreibung Werte
@type Art der Ortsbezeichnung
salute Anrede, Grußformel
seg Textsegment
Attribut Beschreibung Werte
@ana inhaltliche Annotation
space horizontaler Leerraum nur als <space/>
surname Nachname
unclear unsichere Lesart
Attribut Beschreibung Werte
@reason Grund
"damage" Beschädigung
"faded"
"hand"
"knick" Knick
"overwriting"
"rubbing"
"shorthand" Kurzschrift
w einzelnes Wort wird benutzt, um in der Vorlage zusammengeschriebene Wörter als separate Einheiten zu kennzeichnen

Darstellung von Textphänomenen

Handschriftenspezifische Phänomene

Dieses Wort ist eine Hinzufügung.

  • Eine intralineare Einfügung darüber.
  • Eine interlineare Einfügung darunter.
  • Eine Einfügung am oberen Seitenrand.
  • Eine Einfügung am unteren Seitenrand.
  • Eine Einfügung am Rand der Hand arzt.
  • Eine Einfügung auf der Zeile.
  • Ein Zusatz, der auf anderer Briefseite weitergeht.

Dieses Wort ist eine Streichung.

Nach diesem Wort findet ein Wechsel zum Medium "ink" des Schreibers "patient" statt.

Diese zweiWörter sind separate Tokens.

Allgemeine Formatierungen

Dieser Text ist zentriert.

Dieser Text ist rechtsbündig.

Dieses Wort ist in lateinischer Schrift (ansonsten Kurrentschrift).

Dieses Wort ist tiefgestellt.

Dieses Wort ist hochgestellt.

Dieses Wort ist unterstrichen.

Eine Klinik liegt in Münster (nur bei westfälischen Patientenbriefen annotiert).

M. ist ein abgekürzter Nachname.


Technische Implementation

Minimalistische Voraussetzungen

Der technische Ansatz der Präsentation der Edition und aller Begleittexte hat zum Ziel, mit möglichst wenig Voraussetzungen aus den vorhandenen XML-Daten eine komplett lauffähige Webseite zu erstellen, für deren Hosting kein weiterer Software-Stack (außer einem Webserver) nötig ist. Für das Erstellen der für die Tabellen und Aktenansichten nötigen Datenexzerpte sowie für die Generierung der HTML-Ansichten der einzelnen Dokumente und Begleittexte sind lediglich die beiden Tools jq und xsltproc Voraussetzung.

TEI-Transformation

Die Transformation der einzelnen Texte aus XML in eine HTML-Ansicht mithilfe von XSLT 1.0 erfolgt vollständig über die Konvertierung von XML-Elementen in das HTML-Element <span> mit entsprechenden @data-Attributen:


<!-- TEI text elements -->
<xsl:template match="/t:TEI/t:text//t:*">
  <span class="tei-{local-name(.)}">
    <xsl:call-template name="set-data-attributes"/>
    <xsl:apply-templates/>
  </span>
</xsl:template>

<!-- data attributes -->
<xsl:template name="set-data-attributes">
  <xsl:for-each select="@*">
    <xsl:call-template name="data-attribute">
      <xsl:with-param name="name" select="name(current())"/>
      <xsl:with-param name="value" select="current()"/>
    </xsl:call-template>
  </xsl:for-each>
</xsl:template>

<!-- single data attribute -->
<xsl:template name="data-attribute">
  <xsl:param name="name"/>
  <xsl:param name="value"/>
  <xsl:attribute name="data-{translate($name, ':', '-')}">
    <xsl:value-of select="$value"/>
  </xsl:attribute>
</xsl:template>

Die ausschließliche Verwendung von <span>-Elementen hat den positiven Nebeneffekt, dass stets valides HTML produziert wird. Die Gestaltung der einzelnen Textelemente wird mit wenigen Zeilen CSS realisiert. Besondere Effekte wie die Einbindung der Faksimilebilder und eine Verfeinerung der Textdarstellung v. a. bzgl. rechtsbündigem und zentriertem Text werden mit Javascript umgesetzt. Dabei ist der gesamte Quellcode dieser Webseite öffentlich und kann für ähnlich ansetzende Projekte unter der Lizenz CC BY-SA 4.0 nachgenutzt werden.

Die Auslieferung der generierten Webseite benötigt nur einen Webserver. Alle für den Betrieb nötigen Dateien, Schriften und Bibliotheken werden im Paket mitgeliefert, aufwendige Rechenzeit für Server entfällt. Damit folgt das Projekt den Zielen der Digital Humanities Climate Coalition für einen nachhaltigeren und bewussteren Umgang mit den begrenzten Ressourcen aus Sicht der Digital Humanities.


Nachnutzung

Logo CC BY-SA 4.0 Alle Textquellen im XML-Format TEI P5 sowie der Quellcode zur Erstellung dieser Webseite sind unter Beachtung der Lizenz Namensnennung – Weitergabe unter gleichen Bedingungen 4.0 International (CC BY-SA 4.0) verfügbar: