Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis.

28
Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis

Transcript of Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis.

Page 1: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis.

Eine korpusbasierte Geschichte des deutschsprachigen Romans

Göttingen, 15.8.2012

Fotis Jannidis

Page 2: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis.

Ziel

• Monographische Darstellung (vulgo: Buch)• Theoriebaustelle 1:

Kritik an der (Literatur-)Geschichte• Theoriebaustelle 2:

Modelle historiographischer Präsentation• Zwischenstand:

Patchwork von Mikronarrativen; Hypertext?

Page 3: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis.

Komponenten (Mikronarrative)

• Epochen• Gattungsentwicklungen (Bildungsroman usw.)• Werkentwicklungen• Narrative Muster• Synchrone Feldanalyse• Ausdiff. lit. Kommunikationssysteme, z.B. Populäre

Lit.• Einzeltextinterpretation• …

Page 4: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis.

Komponenten mit Korpusforschung

• Epochen• Gattungsentwicklungen (Bildungsroman usw.)• Werkentwicklungen• Narrative Muster• Synchrone Feldanalyse• Ausdiff. lit. Kommunikationssysteme, z.B. Populäre

Lit.• Einzeltextinterpretation• …

Page 5: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis.

Forschungsstand: Material

• USA: Bsp: ca. 3.000 Romane des 19. Jh.• D: 650 Romane (TextGridRep)

Page 6: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis.

Forschungsstand: Methoden

• Ngram-Verlauf in der Zeit• Stylometrie• Regelbasierte Analyse• Machinelles Lernen• Topic Modeling

Page 7: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis.

The method

• John Burrows: Delta• Basis: most frequent words (mostly stopwords)• A measure for the relative stilistic distance

between texts• „the mean of the absolute differences between

the z-scores for a set of word-variables in a given text-group and the z-scores for the same set of word-variables in a target text“

Page 8: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis.

Z-score

x is a raw score to be standardizedμ is the mean of the populationσ is the standard deviation of the population

Page 9: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis.

Assigning authors of American novels (Hoover 2004)

Page 10: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis.

Validity

• With texts longer than 2000 words Burrows‘ Delta is a good indicator for the correct author

• With shorter texts in 85% of all cases the correct author is one of the first five names

Page 11: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis.

The tool

• R Script by Maciej Eder, Jan Rybicki

Page 12: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis.
Page 13: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis.

Some ‚results‘

Page 14: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis.
Page 15: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis.
Page 16: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis.
Page 17: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis.
Page 18: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis.
Page 19: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis.
Page 20: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis.
Page 21: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis.
Page 22: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis.
Page 23: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis.

Stand der Dinge: Eine Einschätzung

• Kalibrierung der Instrumente• Fruchtbare Verwendungsformen• Viel Platz zwischen Heilsversprechen und

Verteufelung

Page 24: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis.

Probleme quantitativer Textanalyse

• Typische Probleme: Mangelndes historisches Wissen, unbrauchbare Texte, falsche Indikatoren, unzulänglich gehandhabte statistische Verfahren

• Wahrscheinlichkeitsaussagen in den Geisteswissenschaften

• Trivial?

Page 25: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis.

Mapping Models

• Genre und Gender Konzepte

unddiederzusieicherindendassichmitnichtsoeindemvonesaufwaralswie

Narrative, descriptions of erotic actions and tableaux,

staging of bodies, language of seduction

Bag of Words

Mos

t fre

quen

t wor

ds

Page 26: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis.

Quantitative Verfahren und die Literaturwissenschaft

• Ersatz oder Ergänzung?• Ein neues Paradigma?• Empirische Psychologie und korpusbasierte

Verfahren• Vs. oder Koop

Page 27: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis.

Quantitative Ansätze basieren auf sehr diversen Kompetenzen. Das problem der Interdisziplinarität

Page 28: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis.

Literatur

• John Burrows: Delta: A Measure for Stylistic Difference and A Guide to Likely Authorship. In: LLC 17,3 (2002).

• TextGridRephttp://textgridrep.de/repository.html

• The R Script for Stylometric Analyseshttps://sites.google.com/site/computationalstylistics/

• Ryan Heuser, Long Le-Khac: A Quantitative Literary History of 2,958 Nineteenth-Century British Novels: The Semantic Cohort Method. Stanford LabReport May 2012. http://litlab.stanford.edu/LiteraryLabPamphlet4.pdf