Wenn man über psychologische Tests spricht, wird oft gefragt, ob der Test gültig ist oder nicht. Was genau bedeutet das? Validität ist ein Maß dafür, wie gut ein Test misst, was er zu messen vorgibt.1
Die psychologische Beurteilung ist ein wichtiger Bestandteil sowohl der experimentellen Forschung als auch der klinischen Behandlung. Eine der größten Bedenken bei der Erstellung eines psychologischen Tests besteht darin, ob er tatsächlich das misst, was wir denken, dass er misst.
Zum Beispiel könnte ein Test so konzipiert sein, dass er ein stabiles Persönlichkeitsmerkmal misst, aber stattdessen vorübergehende Emotionen misst, die durch situative oder Umweltbedingungen erzeugt werden. Ein gültiger Test stellt sicher, dass die Ergebnisse die zu bewertende Dimension genau widerspiegeln.2
Validität ist das Ausmaß, in dem ein Test das misst, was er zu messen vorgibt. Es ist wichtig, dass ein Test valide ist, damit die Ergebnisse richtig angewendet und interpretiert werden können.
Gültigkeitsarten
Die Validität wird nicht durch eine einzelne Statistik bestimmt, sondern durch eine Reihe von Forschungsergebnissen, die die Beziehung zwischen dem Test und dem Verhalten, das er messen soll, aufzeigen. Es gibt drei Arten von Gültigkeiten.
Inhaltsgültigkeit
Bei einem Test mit Inhaltsvalidität stellen die Items des Tests die gesamte Bandbreite möglicher Items dar, die der Test abdecken sollte.3 Einzelne Testfragen können aus einem großen Pool von Items gezogen werden, die ein breites Themenspektrum abdecken.
In einigen Fällen, in denen ein Test ein schwer zu definierendes Merkmal misst, kann ein sachverständiger Richter die Relevanz jedes Elements bewerten. Da jeder Richter seine Bewertung auf der Grundlage seiner Meinung gründet, bewerten zwei unabhängige Richter den Test getrennt. Items, die von beiden Juroren als stark relevant eingestuft werden, werden in die Abschlussprüfung aufgenommen.
Kriterium-bezogene Gültigkeit
Ein Test hat kriteriumsbezogene Validität, wenn der Test seine Wirksamkeit bei der Vorhersage von Kriterien oder Indikatoren eines Konstrukts gezeigt hat, beispielsweise wenn ein Arbeitgeber neue Mitarbeiter auf der Grundlage normaler Einstellungsverfahren wie Interviews, Ausbildung und Erfahrung einstellt.4
Diese Methode zeigt, dass Personen, die bei einem Test gut abschneiden, bei einem Job gut abschneiden und Personen mit einer niedrigen Punktzahl bei einem Test schlecht abschneiden. Es gibt zwei verschiedene Arten der Kriteriumsvalidität:
- Gleichzeitige Validität: Dies tritt auf, wenn Kriteriumsmaße gleichzeitig mit den Testergebnissen erhalten werden5, was die Fähigkeit von Testergebnissen zur Einschätzung des aktuellen Zustands einer Person anzeigt. Bei einem Test, der das Ausmaß der Depression misst, würde man beispielsweise sagen, dass der Test gleichzeitig gültig ist, wenn er das aktuelle Ausmaß der Depression misst, das der Testteilnehmer erlebt hat.
- Prädiktive Validität: Dies ist der Fall, wenn die Kriterienmaße zu einem Zeitpunkt nach dem Test erhalten werden.6 Beispiele für Tests mit prädiktiver Validität sind Berufs- oder Eignungstests, die hilfreich sind, um festzustellen, wer in bestimmten Fächern oder Berufen wahrscheinlich erfolgreich sein oder durchfallen wird.
Konstruktvalidität
Ein Test hat Konstruktvalidität, wenn er einen Zusammenhang zwischen den Testergebnissen und der Vorhersage eines theoretischen Merkmals zeigt.7 Intelligenztests sind ein Beispiel für Messinstrumente, die Konstruktvalidität besitzen sollten. Ein valider Intelligenztest sollte in der Lage sein, das Intelligenzkonstrukt und nicht andere Merkmale wie Gedächtnis oder Bildungsstand genau zu messen.
Im Wesentlichen untersucht die Inhaltsvalidität, ob ein Test das gesamte Spektrum der Verhaltensweisen abdeckt, aus denen das gemessene Konstrukt besteht. Das Verfahren hier besteht darin, notwendige Aufgaben zu identifizieren, um eine Arbeit wie Tippen, Design oder körperliche Fähigkeiten auszuführen.
Um die inhaltliche Validität eines Auswahlverfahrens zu demonstrieren, sollten die bei der Auswahl demonstrierten Verhaltensweisen ein repräsentatives Beispiel für die Verhaltensweisen der Stelle sein.
Gesichtsvalidität bei psychologischen Tests
Eine andere Methode, die selten verwendet wird, weil sie nicht sehr ausgereift ist, ist die Gesichtsvalidierung. Er basiert nur auf dem Erscheinungsbild der Messgröße und dem, was sie messen soll, nicht jedoch auf dem, was der Test tatsächlich misst.
Die Facevalidität ist eines der grundlegendsten Validitätsmaßstäbe. Im Wesentlichen nehmen die Forscher die Validität des Tests einfach zum Nennwert, indem sie prüfen, ob ein Test die Zielvariable zu messen scheint.8 Bei einem Glücksmaß beispielsweise würde man sagen, dass der Test scheinbare Gültigkeit hat tatsächlich den Grad des Glücks messen.
Offensichtlich bedeutet Gesichtsvalidität nur, dass der Test so aussieht, als ob er funktioniert. Es bedeutet nicht, dass der Test nachweislich funktioniert. Wenn die Maßnahme jedoch zu diesem Zeitpunkt gültig zu sein scheint, können die Forscher weitere Untersuchungen durchführen, um festzustellen, ob der Test gültig ist und in Zukunft verwendet werden sollte.
Im Wesentlichen geht es bei der Face Validität darum, ob ein Test das zu messen scheint, was er messen soll. Es beinhaltet den Test zum Nennwert.
Einer Umfrage, bei der gefragt wird, für welchen politischen Kandidaten sie zu stimmen beabsichtigen, wird eine hohe Gesichtsvalidität nachgesagt. Der Zweck des Tests ist sehr klar, auch für Personen, die mit Psychometrie nicht vertraut sind.
Ein komplexer Test, der als Teil eines psychologischen Experiments verwendet wird, das eine Vielzahl von Werten, Merkmalen und Verhaltensweisen untersucht, kann als geringe Gesichtsvalidität bezeichnet werden. Der genaue Zweck des Tests ist insbesondere den Teilnehmern nicht sofort klar.
Obwohl die Gesichtsvalidität ein gutes Werkzeug sein kann, um festzustellen, ob ein Test das zu messen scheint, was er zu messen vorgibt, bedeutet die Gesichtsvalidität allein nicht, dass ein Test tatsächlich gültig ist. Manchmal sieht ein Test so aus, als würde er eine Sache messen, während er tatsächlich etwas ganz anderes misst.