TextQuest - Software

Suche



Wörterlisten

Eine Wörterliste ist eine Liste aller in einem Text vorkommenden Zeichenketten, das sind meist - aber nicht immer - Wörter. Diese werden gezählt und alphabetisch aufsteigend sortiert. Wörterlisten eignen sich

  • als Hilfsmittel zur Kategorienbildung bei Inhalts- und Stilanalysen
  • zur Überprüfung der Rechtschreibung und eventueller Transkriptionsregeln

Durch verschiedene Optionen wie Einbinden einer Sortiertabelle (in der Datei sort.def), Ignorieren der Unterschiede zwischen Groß- und Kleinschreibung und einer Ausschlussliste (auch STOP-Wörter genannt) sowie Beschränken auf der Basis von Länge und Häufigkeit von Zeichenketten läßt sich die Wörterliste reduzieren. Mit einem Sortierprogramm kann auch nach Häufigkeit absteigend sortiert werden, so dass die häufigsten Zeichenketten zuerst in der Wörterliste erscheinen.

Der in TextQuest implementierte Algorithmus ist sehr schnell: die alphabetisch sortierte Wörterliste einer 7 MB großen Datei mit 909.594 Zeichenketten braucht auf einem 2 GHz schnellen Rechner nur 25 Sekunden.