TextQuest - Software

Suche



Wortschatzanalyse

Der Untersuchung des Wortschatz eines Textes wird mit mehreren Modulen realisiert:

  • Wörterliste: eine alphabetisch sortierte Liste aller im Text vorkommenden Zeichenketten und ihrer Häufigkeit
  • Wortsequenzliste: wie eine Wörterliste, aber statt einzelner Zeichenketten Sequenzen von Zeichenketten, z.B. Bundesrepublik Deutschland oder im großen und ganzen
  • Wortpermutationsliste: jede Zeichenkette innerhalb einer Texteinheit wird mit jeder ihr folgenden Zeichenkette als 2-Wort-Wortsequenz kombiniert.
  • Vokabularwachstum (TTR-Dynamik): die Entwicklung der TTR-Werte (type-token ratio) wird ausgegeben. Dieser Wert beginnt immer bei 1 (jede Zeichenkette kommt einmal im Text vor) und wird immer niedriger, ohne jedoch 0 je zu erreichen. Der Vergleich von TTR-Werten macht nur bei gleichs großen Texten Sinn.

Möglichkeiten bei Wörterlisten:

 

Möglichkeiten bei Wortsequenzlisten:

 

Möglichkeiten bei Wortpermutationslisten:

 

Möglichkeiten bei Vokabularwachstum: