Grundsätzliches

<< Click to Display Table of Contents >>

Navigation:  Datenmodifikation > Fehlende Werte >

Grundsätzliches

Hinsichtlich fehlender Werte sind verschiedene Fälle zu unterscheiden:

1. Der/die Befragte hat auf eine Frage keine Antwort gegeben (das klassische "keine Angabe")

oder

2. eine Frage wird aufgrund von Filterkriterien an eine/n Befragte/n gar nicht gestellt (das klassische "Trifft nicht zu").

Nur im ersten Fall liegt ein MISSING VALUE im engeren Sinne vor; im zweiten Fall ziehen wir es vor, von einer Filterung zu sprechen.

Eine gefilterte Variable wird oft so dargestellt, dass die Gesamttabelle nur auf Basis der Fälle berechnet wird, für die die Filterkriterien zutreffen. Dies schlägt dann auch auf die Tabellen-Basis durch. Technisch kann man dies durch die FILTER-Statements lösen.

Bei echtem MISSING kann es unterschiedliche Strategien der Darstellung geben.

Eine weitverbreitete Strategie ist es, alle Fälle mit MISSING in der Tabelle unter der Rubrik "keine Angabe (k.A.)" abzubilden. Das legt zunächst nahe, diese Werte technisch nicht als MISSING VALUES zu betrachten, sondern sie als ganz normale Kategorie zu erfassen und auszuwerten. Soweit die Variable als numerische Größe in Mittelwerte, Varianzen etc. eingeht, ist sie i.d.R. aber aus den Berechnungen auszuschließen. Dieses Vorgehen erfordert bei Mehrfachnennungsvariablen aber einen fehlerträchtigen Zusatzaufwand. Der Erfasser/Codierer muss bei diesen Fragen immer zusätzlich erwägen, ob eine Variable als "k.A." gekennzeichnet werden soll.

GESStabs stellt deshalb den zusätzlichen Mechanismus des AUTONOANSWER bereit: für alle Variablen mit dieser Eigenschaft generiert das System automatisch einen k.A.-Wert, wenn für eine Variable kein gültiger Wert vorliegt - es sei denn, dass die Filterbedingung die Variable für den aktuellen Fall als unzutreffend ausfiltert. Dies gilt systematisch für alle Variablen, seien sie nun atomare Variablen oder Variablen für Mehrfachnennungen. Dieses Konzept baut z.T. auf dem ursprünglichen MISSING-Konzept auf: so ist eine einfache (atomare) Variable immer dann "k.A.", wenn sie MISSING ist, eine MultiQ oder VarFamily immer dann, wenn alle beteiligten Nennungen MISSING sind. Eine VARGROUP oder DICHOQ ist immer dann "k.A."., wenn es keine positive Nennung gibt.

Daten aus einem eingelesenen Dateninput können durch ein spezielles MISSING-Zeichen (MISSINGCHAR) oder einen (oder mehrere) numerischen Wert, die als fehlende Werte definiert werden (siehe MISSING), als fehlend markiert werden. Dies gilt ebenso für den Datenoutput.

Die Darstellung fehlender Werte in Tabellen kann ebenfalls flexibel gehandhabt werden, siehe hierzu USECASES.


Als empfehlenswerte Standardstrategie sei hier noch einmal zusammengefasst:

Vorbereitende Definition und Einstellungen:

1.Generell AUTONOANSWER als Voreinstellung benutzen.

2.Fehlende Werte als MISSING erfassen (macht der GESS-Input automatisch).

Tabellierung:

3.Entweder Fragebogenfilter setzen (SETFILTER/ENDFILTER) oder Tabellen explizit filtern (TABSELECT)

4.USESCASES auf XANDYVALID setzen.

5.USEMISSING auf NO setzen.  


Vererbung von MissingValues

Werden Variablen in arithmetischen Berechnungen (COMPUTE-Statements oder im COMPUTE-Teil einer IF-Anweisung) angesprochen, für die Missing Values definiert sind, so ist das Ergebnis ebenfalls MISSING, wenn der aktuelle Wert einer der in die Berechnung eingehenden Variablen MISSING ist. Außerdem erhält die Variable den numerischen Wert, der durch SETMISSING definiert ist.

Bei Berechnungen mit COMPUTE LOAD, COMPUTE COPY etc. wird der Variableninhalt inclusive der geltenden MISSING übertragen.