Definition und Einstellungen

<< Click to Display Table of Contents >>

Navigation:  Datenmodifikation > Fehlende Werte >

Definition und Einstellungen

GESStabs stellt für die Definition von und den Umgang mit fehlenden Werte unterschiedliche Werkzeuge bereit:

AUTONOANSWER: einheitliches Verhalten bei fehlenden Werten für alle Variablentypen

MISSING: Definition einzelner Ausprägungen von atomaren Variablen als fehlende Werte

SETMISSING: Definition des Ergebniswerts aus einer Berechnung, in die undefinierte Variablen eingehen

MISSINGCHAR: Kennwert für fehlende Werte beim Dateninput und -output

EXPANDMISSINGTEXT: Text für fehlende Werte bei ALPHA-Variablen

BLANKVALUE: Text für leeres Eingabefeld

IGNOREMISSING: (Nicht-)Ausführen einer Operation, wenn fehlende Werte beteiligt sind

SPSS-spezifische Einstellungen


AutoNoAnswer

Syntax:

AUTONOANSWER [ <varlist> ] = [ YES "noanswertext" | NO ] 
[ LEVEL < number > ];

Mit AUTONOANSWER kann man unabhängig vom Variablentyp (SINGLEQ, DICHOQ, VARGROUP, MULTIQ, NumQ oder OPENVAR) ein einheitliches Verhalten bei fehlenden Werten erreichen. Bei YES wird automatisch ein zusätzliches Variablenlabel mit dem "noanswertext" erzeugt. Außerdem wird ein logischer Schalter gesetzt, dass die Variable bei fehlendem gültigem Wert den K.A.-Wert liefert.

AUTONOANSWER wird entweder als globale Voreinstellung gesetzt (ohne <varlist>), oder man bezieht sich auf explizite Variablen (dann bleibt die Voreinstellung für alle weiteren Variablen unverändert). Die Voreinstellung gilt für alle Variablen/ Labelgenerierungen nach dem Statement bis zum nächsten AUTONOANSWER-Statement.

Man kann auch Schriftarten für den "noanswertext" angeben, zum Beispiel:

AUTONOANSWER = YES ’N.A.’ USEFONT "Helvetica" SIZE 10 LEVEL 98;

Mit der LEVEL-Komponente kann man einen CountLevel für die AUTONOANSWER-Kategorie setzen. Ein LEVEL <> 0 gibt an, dass der Häufigkeitswert nicht in MULTUTOTAL summiert werden soll (siehe TableFormate MULTITOTALX und MULTITOTALY).


Missing

Erlaubt die Definition von einzelnen Ausprägungen atomarer Variablen als MISSING VALUES.

Syntax:

MISSING <Varlist> = { number }*n;

In einem MISSING-Statement dürfen bis zu drei Labelwerte als MISSING deklariert werden.


SetMissing

Syntax:

SETMISSING <Varlist> = { number }*n;

Mit SETMISSING wird der Wert definiert, der als Resultat einer Berechnung gesetzt werden soll, wenn undefinierte Variablen in einer Berechnung vorkommen, die Berechnung also nicht möglich ist. Dieser Wert wird in SYSMISS gespeichert.

Das gilt für atomare Variablen. MULTIQ und DICHOQ kennen keinen Missing Value. Sie haben im entsprechenden Fall einfach eine leere Wertemenge.


 

MissingChar

MISSINGCHAR definiert einen Kennwert als Kennzeichnung von MISSING VALUES beim Dateninput und -output.

Syntax:

MISSINGCHAR = "<char>";

Voreinstellung: MISSINGCHAR = "M";


ExpandMissingsText

Betrifft Variablen mit der Eigenschaft ALPHA

Syntax:

EXPANDMISSINGTEXT = <string>;

Beim Export von ALPHA-Variablen kann für fehlende Werte ein spezieller Text vereinbart werden.

Voreinstellung: "MISSING"


BlankValue

BLANKVALUE setzt einen Wert für ein leeres Eingabefeld. In der Praxis ist dies nur für spaltenfixierte Datensätze relevant, siehe Variablen in ASCII.


IgnoreMissing

Bedeutet: Ignoriere den Vergleich, wenn MISSING im Spiel

Syntax:

IGNOREMISSING = [ YES | NO ];

Voreinstellung: IGNOREMISSING = NO;

Missing Values nehmen an allen Operationen teil. Dies führt dazu, dass ein Test

SETMISSING = -1;

...

...

IF var003 LT 2 THEN ....

auch dann TRUE ergibt, wenn var003 in diesem Beispiel den Missing-Wert -1 hat. Die Verarbeitung von Daten mit fehlenden Messwerten verlangte eigentlich nach einer dreiwertigen Logik: WAHR - FALSCH - UNENTSCHEIDBAR. Die generelle Konvention von GESStabs an dieser Stelle unterscheidet zwischen dem Wert einer Variablen, die für Tests herangezogen werden, und der Eigenschaft, dass dieser Wert MISSING sein kann. Und da der globale Missingwert -1 in diesem Fall kleiner als 2 ist, liefert der Test im Beispiel TRUE.

Setzt man IGNOREMISSING = YES, so wird das Verhalten an dieser Stelle global modifiziert. Die numerischen Werte von Variablen mit der Eigenschaft MISSING sind dann nur noch für die Tests EQ und NE greifbar. Die anderen Tests (LT, GT, GE oder LE) liefern dann immer den Wert FALSE.


SPSS-spezifische Einstellungen

IgnoreSPSSMissingValues

Ignorieren der in einem eingelesenen SPSS-Datensatz als MISSING definierten Werte, siehe Input von SPSS-Datensätzen.

IgnoreSPSSSysMisVal

Werte, die beim Einlesen eines SPSS-Datenfiles den Wert des internen SysmisVal von SPSS hat, wird durch den SETMISSING-Wert von GESS ersetzt. Siehe Input von SPSS-Datensätzen.