TextQuest - Software

Suche



Antworten auf offene Fragen codieren

Das Codieren von Antworten auf offen Fragen ist ein sehr zeit- und damit kostenintensiver Prozess. Eine Automatisierung ist bei homogenen Antworten gut realisierbar, wenn auch der Aufwand anfangs etwas groß erscheint.

Wenn der Text der Antworten vorliegt, muss er so aufbereitet werden, dass er mit TextQuest verarbeitet werden kann. Bei der Benutzung von Statistiksoftware (z.B. SPSS), wird der Text in eine reine Textdatei herausgeschrieben und mit dem festen Format von TextQuest eingelesen. Es müssen zusätzlich zum Text noch weitere Variablen herausgeschrieben werden, damit nach der Codierung der Antworten der offenen Fragen die numerischen Ergebnisse der Ursprungsdatei den anderen Daten zugespielt werden können.

Beim festen Format stehen die Werte der Variablen und des Textes immer an der gleichen Position (Spalte) innerhalb einer Zeile, jede Antwort steht auf einer einzigen Zeile. Die Variablen aus dem numerischen Datensatz stehen am Anfang, danach folgt dahinter der Text.

Nach dem Generieren der Systemdatei muss ein Kategoriensystem für jede zu analysierende Frage entwickelt werden. Wenn  5 verschiedene offene Fragen vorhanden sind, sind auch 5 Kategoriensysteme erforderlich. Die Entwicklung der Kategoriensysteme erfolgt durch den Kategorienmanager von TextQuest, folgende Hilfsmittel können benutzt werden - teilweise auch im Kategorienmanager selbst:

  • eine Wörterliste
  • eine Liste von Wortsequenzen
  • eine Liste von Wortpermutation
  • KWIC (key-word-in-context) Listen
  • SIT (Suchbegriff in Texteinheit) Listen

Wenn das Kategoriensystem fertig ist, erfolgt die Codierung. Sinnvollerweise wird die Datei der Zähler für die statistische Analyse weiter verarbeitet, TextQuest generiert das entsprechende Setup (Syntaxdatei) für SAS, SimStat, ConClus oder SPSS. Zu den Kontrolldateien gehört die Datei der nicht codierten Texteinheiten, diese sollte möglichst klein (< 5%) oder am besten leer sein. Eine iterative Arbeitsweise besteht darin, dass mit immer mehr Suchbegriffen codiert wird und mit der Datei der uncodierten Texteinheiten das Kategoriensystem immer weiter verfeinert wird. Da der Codiervorgang nur kurze Zeit (< 5 Minuten) in Anspruch nimmt, können beliebig viele Codierungen erfolgen.

Der letzte Schritt besteht dann dar, die durch TextQuest gewonnenen Daten mit den Ursprungsdaten zu aggregieren, in dem man diese Variablen dem Datensatz hinzufügt.