http://www.2ask.de/Zusammenhangsmasse--680d.html

  zur Startseite von 2ask

Zusammenhangsmaße

Im Gegensatz zu den vorangegangenen Kapiteln werden nun die verschiedenen erhobenen Variablen nicht mehr einzeln und voneinander isoliert betrachtet (= univariate Statistik), sondern miteinander in Verbindung gebracht. Es werden zwei Merkmale gleichzeitig betrachtet (= bivariate Statistik).

 Alle Zusammenhangsmaße, die in diesem Kapitel besprochen werden untersuchen ausschließlich lineare Zusammenhänge zwischen zwei Variablen. Lineare Zusammenhänge sind die am meisten untersuchten Zusammenhänge.
Auf Basis dieser Maße können also lediglich Rückschlüsse gezogen werden, die sich auf lineare Zusammenhänge beziehen. Mit Hilfe dieser Zusammenhangsmaße können Sie also lediglich eine Aussage der Form treffen, dass zwischen zwei untersuchten Variablen ein bzw. kein linearer Zusammenhang besteht.
Eine allgemeine Aussage der Form „zwischen den beiden Variablen besteht kein Zusammenhang“ kann nicht getroffen werden, da mit diesen Maßen keine Aussagen über andere Arten von Zusammenhängen (z.B. U-förmige Zusammenhänge) möglich sind.
 

Alle nachfolgend erklärten Zusammenhangsmaße untersuchen, ob zwischen einer Variablen X (z.B. Geschlecht) zu einer Variablen Y (z.B. Produkt gekauft ja/nein) ein linearer Zusammenhang besteht.

 Wenn im Folgenden von Zusammenhängen oder Zusammenhangsmaßen die Rede ist sind immer lineare Zusammenhänge bzw. lineare Zusammenhangsmaße gemeint. 

Es gibt eine Reihe verschiedener Zusammenhangsmaße. Wann welches Maß verwendet wird ist abhängig vom Skalenniveau der Daten.

Mit der Hilfe von Zusammenhangsmaßen versucht man die Beziehung zwischen zwei Variablen zu untersuchen. Es gibt dabei für jedes Skalenniveau spezifische Zusammenhangsmaße.

Zur Einführung ein paar allgemeine (Skalenniveau unabhängige) Aussagen bezüglich linearer Zusammenhangsmaße:

Der Zusammenhang zwischen X und Y entspricht dem Zusammenhang zwischen Y und X
Der Zusammenhang zwischen X und X ist immer 1
Der Zusammenhang zwischen Y und Y ist immer 1

Lineare Zusammenhangsmaße liegen in einem Wertebereich zwischen minimal -1 und maximal +1.
Werte außerhalb dieses Bereiches sind nicht möglich!!!

Es gilt:
„-1“ spiegelt einen perfekten negativen Zusammenhang der Form „je größer X, desto kleiner Y" wieder und würde graphisch dargestellt folgendermaßen aussehen:

„+1“gibt einen perfekten positiven Zusammenhang der Form "je größer X, desto größer Y" wieder und würde graphisch dargestellt folgendermaßen aussehen:

Wenn der Wert für das Zusammenhangsmaß 0 aufweist, hängen die beiden Merkmale überhaupt nicht linear zusammen.

Der hier abgebildete Zusammenhang beträgt mit -0,02 beinahe Null.

Wie bereits erwähnt können Variablen allerdings in nicht-linearer Weise (z.B. U-förmig) voneinander abhängen

Lineare Zusammenhangsmaße geben für den hier abgebildeten Zusammenhang  einen Wert von 0,00 an. Allerdings ist zu erkennen, dass ein ausgeprägter U-förmiger Zusammenhang besteht.

Werte linearer Zusammenhangsmaße werden i.a. wie folgt interpretiert:

Ein Zusammenhang, egal ob positiv oder negativ ist erst ab einem Betrag von 0,2 ein statistischer Zusammenhang, da er vorher noch zu gering ist, d.h. eher zufällig. In dem Fall ist als Interpretation gültig: Der Zusammenhang geht gegen Null.
Die Wahl des Zusammenhangsmaßes ist abhängig vom Skalenniveau der Variablen.



Theoretische Einleitung

Wenn Sie den Zusammenhang zwischen zwei Variablen X und Y untersuchen möchten, ist es ein erster wichtiger Schritt die Daten in einer sinnvollen Form anzuordnen. Eine übersichtliche Darstellung der Daten erfolgt in einer Kreuztabelle.
Diese hat folgende allgemeine Form:


Die Variable X wird dabei in den Spalten abgetragen (x1, x2,?cxi), die Variable Y  in den Zeilen (y1, y2,?c,yi).
Es gilt: eine Kreuztabelle hat die Form r *c. Dabei steht r für "row" (engl. Zeile) und c für "column" (engl. Spalte).
Demnach sind beispielsweise folgende Formate möglich: 2x2-Kreuztabelle, 4x3-Kreuztabelle, 5x7-Kreuztabelle

Die allgemeine Bezeichnung der einzelnen Felder lautet fij. Diese setzt sich folgendermaßen zusammen:
die erste Zahl (Bezeichnung i) bezieht sich auf die Y-Variable, d.h. die Zeilenposition, die zweite (Bezeichnung j) auf die X-Variable, d.h. die Spaltenposition.
Ein Beispiel: f23 bezeichnet das Feld in der zweiten Zeile, dritte Spalte


Für einige der nachfolgenden Zusammenhangsmaße ist es notwendig, die Randsummen zu berechnen.
Um die Randsumme für Zeile 1 zu berechnen werden alle Felder der ersten Zeile addiert,
 d.h. f11 + f12 + f13 +... + f1j oder kürzer ausgedrückt:

Um die Randsumme für die Spalte 1  zu berechnen werden alle Felder der ersten Spalte addiert,
d.h. f11 + f21 + f31 +...+ fi1 oder kürzer ausgedrückt

Die Summe aller Zeilen und aller Spalten ergibt die Anzahl der Gesamtfälle = N


Zusammenhangsmaß für zwei nominalskalierte Variablen

Die gebräuchlichsten Maße für den Zusammenhang zweier nominalskalierter Variablen sind PHI und Cramers V.
PHI wird berechnet, wenn der Zusammenhang zweier Merkmale mit jeweils genau zwei Merkmalsausprägungen untersucht werden soll (d.h. bei einer 2x2-Kreuztabelle). Cramers V wird berechnet, wenn ein Merkmal mehr als 2 mögliche Ausprägungen besitzt.

Um die Zusammenhangsmaße PHI und Cramers V berechnen zu können muss vorher die Berechnung des Faktors chi-Quadrat erfolgen.

Chi-Quadrat basiert auf der folgenden Überlegung:
Besteht ein Unterschied zwischen der existierenden (empirischen) Beziehung und der theoretischen (zufälligen) Beziehung?


Zusammenhangsmaß für zwei ordinalskalierte Variablen

Ordinalskalenniveau erlaubt es rangmäßige Bewertungen anzustellen. Dabei sind die Abstände allerdings noch nicht exakt in mathematischen Zahlen darstellbar. Typische Beispiele für ordinale Skalen sind Schulnoten oder Prestige.
Für ordinalskalierte Daten bieten sich zwei Möglichkeiten an: Man kann den so genannten Rangkorrelationskoeffizienten Spearman`s Rho (rs) nutzen. Dabei wird die Rangplatzdifferenz zwischen einer x und einer y Bewertung betrachtet. Alternativ, aber etwas aufwändiger kann auch Tau-b berechnet werden.


Zusammenhangsmaß für zwei intervallskalierte Variablen

Der Korrelationskoeffizient r ist das bekannteste statistische Zusammenhangsmaß. Er wird als statistisches Maß für den linearen Zusammenhang zwischen zwei mindestens intervallskalierten (d.h. metrischen) Variablen verwendet.

Der Korrelationskoeffizient kann dabei Werte zwischen minimal -1 und maximal +1 annehmen, wobei -1 einen perfekten negativen ("je größer X, desto kleiner Y") und +1 einen perfekten positiven ("je größer X, desto größer Y") Zusammenhang bezeichnet
Wenn der Korrelationskoeffizient den Wert 0 aufweist, hängen die beiden Merkmale überhaupt nicht linear zusammen. Allerdings können diese ungeachtet dessen in nicht-linearer Weise (z.B. U-förmig) zusammenhängen.

Es gilt:
Die Korrelation zwischen X und Y entspricht der Korrelation zwischen Y und X
Die Korrelation zwischen X und X ist immer 1
Die Korrelation zwischen Y und Y ist immer 1

Eine Korrelation größer +1 oder kleiner -1 kann niemals auftreten.


Zusammenhangsmaß für zwei Variablen mit unterschiedlichen Skalenniveaus

Für die Untersuchung von Zusammenhängen mit verschiedenen Skalenniveaus gilt, dass jeweils das Maß für die Variable mit dem niedrigeren Skalenniveau einsetzbar ist.
NACHTEIL: Dies führt zu einem Informationsverlust, da Informationen aus der Skala mit dem höheren Skalenniveau (Rangfolge der Merkmalsklassen, Größe der Merkmalswerte) nicht einfließen.

Eta berücksichtigt die Unterscheidung zwischen abhängiger und unabhängiger Variable. Dieser Koeffizient basiert auf der Berechnung des PRE-Maßes eta²  und beschreibt den Zusammenhang zwischen einer nominal- oder ordinalskalierten unabhängigen Variablen und einer intervallskalierten abhängigen Variable. Das Konzept eines PRE-Maßes soll hier nicht Gegenstand sein und wird daher nicht näher ausgeführt.
Grundsätzlich wäre Eta auch als Zusammenhangsmaß für zwei intervallskalierte Variablen einsetzbar, hierfür sind allerdings die speziellen Maße (siehe Korrelationskoeffizient) besser geeignet.

Ausdrucken
http://www.2ask.de
Tel.://07531 4570725E-Mail://info@2ask.de
Fenster schließen