Beschreibung
Das DFG-Projekt CompAnno entwickelt einen vergleichenden Annotationsworkflow zur computergestützten Detektion und Klassifizierung von literarischen Textähnlichkeiten am Beispiel von Figureneigenschaften als einer Kategorie, die sowohl für die Gestaltung literarischer Texte im Allgemeinen als auch für die Interpretation intertextueller Beziehungen zentral ist. Im Gegensatz zu etablierten Annotationsansätzen beruht die vergleichende Annotation auf der gleichzeitigen Betrachtung mehrerer Textausschnitte. Figureneigenschaften werden zunächst manuell ermittelt und kategorisiert. Darauf aufbauend wird ein Ranking der Ähnlichkeiten erstellt, das zum Trainieren eines maschinellen Lernsystems verwendet wird. Wir entwickeln einen Workflow für eine computergestützte Untersuchung von Textähnlichkeit, die über die Erkennung von text-reuse hinausgeht und nicht auf ein festes Korpus bezogen ist. Gleichzeitig zeigen wir mit der vergleichenden Annotation einen neuen Weg für die Arbeit mit interpretativen Kategorien auf.
Keywords
Annotation
NLP
Maschinelles Lernen
Intertextualität
literarische Figuren
Find me @ my poster | 3, 4 |
---|