This video: Dans cette vidéo : Neste vídeo : 

Testtheorien, Testkonstruktion und Psychologische Diagnostik (2)

Key points Points Clés Dicas 

00:00 Testtheorien, Testkonstruktion und Psychologische Diagnostik (2)

01:46 Beantwortet das Ihre Frage, bitte?

02:19 Einverstanden?

03:03 Den Link, und das wird beim nächsten Mal genau vorgestellt werden.

03:39 Gut, die organisatorischen Fragen scheinen geklärt zu sein. Dann würde ich sagen, gehen wir direkt zu den Inhalten?

09:31 Was macht den Unterschied aus?

10:17 Haben Sie eine Idee?

10:30 Mehrere Skalen, genau, und wenn ich mehrere Skalen kombiniere, wie nenne ich das dann?

11:42 Von welcher Testklasse ist das?

11:57 Ist das Verfahren so, dass wir sagen können, es genügt unseren Gütekriterien?

12:40 So, dann können wir des Weiteren Tests kategorisieren.

13:58 Wohin gegen Gruppentests?

14:14 Sie können im Persönlichkeitstest, angenommen Sie arbeiten hier in München als Personalauswählerin in einem hier ansässigen Großunternehmen. Sie haben natürlich viel, viel mehr Bewerberinnen und Bewerber als Stellen. Sie wissen beispielsweise, dass gewisse Persönlichkeitsmerkmale wichtig für den Erfolg in dieser ausgeschriebenen Stelle sind. Könnten Sie beispielsweise im Persönlichkeitstest alle diejenigen Leute machen lassen, die in die engere Auswahl kommen für diese Stelle?

15:17 Also meinen Sie beispielsweise in Assessment-Centern?

16:11 Das hat einen Test gar nicht zu tun, oder?

17:11 Wann, glauben Sie, sind standardisierte Testverfahren die Methode der Wahl bei der Diagnostik?

17:59 Ja, wie kommen Sie, Sie sind Forscherin, Sie arbeiten also nach angesehenen Standards, was können Sie tun?

18:46 Wie kann man das ansatzweise diagnostizieren?

21:45 Dann darf ich nicht sagen, ich mache jetzt mit Ihnen einen Test, oder ist es ein Test?

22:27 Es gibt einerseits gebundene Aufgabenbeantwortung und freie Aufgabenbeantwortung.

23:39 Was besteht aus Testmaterialien?

26:18 Ja, bitte?

26:39 Form R und Form F und Form S laufen nur beim VOP, oder ist das grundsätzlich so?

26:59 Können Sie sich vorstellen, weshalb man eine Fremdform haben sollte? Also die Selbstform ist der Klassiker, sie ist immer dabei. Warum ist es vorteilhaft, eine Fremdform zu haben?

27:12 In welchem Kontext ist die Überprüfung der Einschätzung des Selbst, sich selbst beurteilenden, von Interesse?

27:32 Wie sieht es aus mit Intelligenztests, wie kann ich die verfälschen?

28:05 Wie sieht's jetzt mit Faking Good und Faking Bad im Persönlichkeitsbereich aus?

28:12 Richtig, genau.

29:16 Was glauben Sie, wie das wirkt?

29:55 Bitte schön.

33:27 Können Sie sich das anschauen?

35:13 Schätzung?

35:57 Aber zu Anschauungszwecken möchte ich es Ihnen trotzdem gerne geben.

38:54 Warum?

39:05 Ideen?

40:46 Ja, das ist eine gute Frage.

41:42 Aber was ist die Lösung?

43:14 Sollte man fragen, welchen Vorteil es bringt, wenn ich die Leute zwinge, irgendwie eine Antwort zu geben, wenn sie aber eigentlich sich für keins von beiden entscheiden können?

43:51 Eine Frage, und zwar, kann man nicht inzwischen diese Missing Values ganz gut schätzen, zum Beispiel über Regressionen oder EM?

44:14 Dann stellt sich die Frage, was macht man damit?

44:57 Die Frage geht danach, bei wie viel Prozent Missing Values muss man das Profil, also hier das Persönlichkeitsprofil eines Probanden, löschen?

46:07 Das gilt nur für welche Testklasse?

46:44 Was ist die Idee dahinter?

46:59 Was wollen sie von mir?

47:21 Möchte der Proband natürlich wissen, was er davon hat?

48:09 Wie könnte so eine Instruktion aussehen?

50:15 Okay?

51:15 Nach dem Motto, ja, was wollen die jetzt eigentlich genau von mir wissen?

52:07 Ein Problem sind zum Beispiel mehrere Gedanken in einem Satz.

52:31 Oder?

54:48 Was kann man tun?

55:50 Für ein Item verschiedene Anzahl an Fragen?

56:09 Aber ich muss doch dann letztendlich bei der Auswertung die Werte schon normieren, oder?

56:30 Welchen Fragebogen?

56:42 als komplexere Konstrukte.

57:51 Wenn der Proband das Item nicht verstanden hat, wie soll dann seine Reaktion für uns als Testauswerter interpretierbar sein?

1:00:02 Gut, jetzt schauen wir uns ein paar Antwortmodi an.

1:01:02 Kennen Sie das Fachwort dafür?

1:01:12 Und warum ist das potenziell für uns als Testdiagnostiker ein Problem?

1:01:38 Woher kommt das vermutlich?

1:02:25 Das heißt, was kann man machen?

1:02:59 Wann sind dichotome Fragen geeignet?

1:03:49 Kinder vielleicht? Ja, das könnte sein.

1:04:06 Intelligentere bevorzugen Dichotomie?

1:07:30 Außerdem werden diese Rating-Skalen als Intervall-Skalen behandelt.

1:07:46 Das heißt, was kann man machen?

1:09:00 Oder solche Art gestaltete Antwortalternativen.

1:09:40 74?

1:11:27 Hier, wie Blitz zu hören verhält sich wie Donner zu, was bitte?

1:13:11 An welchen Flüssen liegen die folgenden Städte?

1:13:56 Bei gutem Wetter ist die Stimmung besser und das gilt insbesondere für welche Personen, was die Neurotizismus-Ausprägung angeht?

1:14:24 Was könnten also Items sein?

1:15:34 Wie bewertet der oder diejenige überhaupt, dass er jetzt als beispielsweise Hilfesuchender vorstellig wird?

1:16:07 Das ist ja ein gängiges Vorurteil, wissen Sie?

1:17:19 Wie wird diese nun erfasst?

1:17:51 Und was vielleicht noch?

Testtheorien, Testkonstruktion und Psychologische Diagnostik (2)

Testtheorien, Testkonstruktion und Psychologische Diagnostik (2)

  • Wenn Sie also organisatorische Fragen haben, die den Fortlauf der Veranstaltung beeinflussen, bitte ich Sie doch, Ihr Wort zu erheben am Anfang der Veranstaltung, dass wir die einzelnen Punkte gleich. Ich sehe Ihre Wortmeldung schon, dass ich, sodass ich das gleich aufgreifen kann, sodass der weitere Veranstaltungsfluss dadurch nicht behindert wird.
  • Dinge, die mir bisher schon bekannt geworden sind, sind hinsichtlich des Formats, der Formatgeschmäcker. Was die Folienhandouts angeht, darf ich Sie um etwas mehr Ruhe bitten.
  • Hinsichtlich der Formatgeschmäcker, was die Folien angeht, stelle ich fest, es gibt Personen, die finden das jetzige in der Kopierfabrik vorfindliche Format wunderbar, wohingegen andere sagen, sie hätten es gern etwas größer.
  • Das ist ein wunderbares Beispiel dafür, dass Menschen unterschiedlich sind und interindividuelle Differenzen in fast allen Lebensbereichen vorfindbar.
  • Für mich als Persönlichkeitspsychologe insofern nicht überraschend.
  • Die Frage ist nur, wie gehen wir damit um, und ich schlage vor, wir machen das so.
  • Diejenigen unter Ihnen, die das kleine Format bevorzugen, kaufen sich das Skript in der Kopierfabrik.
  • Und diejenigen unter Ihnen, die sagen, sie möchten es deutlich größer haben, können sich die Folien im PDF-Format bei dem neuen Service der Unterrichtsmitschau ansehen. Die Herrschaften, die sich die Mühe machen, dankenswerterweise die Vorlesung aufzuzeichnen, können Sie über die Seiten herunterladen.
  • Sie finden die Folien dann immer zur Verfügung gestellt über die Unterrichtsmitschau, sodass Sie alle Formate, ob groß oder klein, zur Verfügung haben.

Beantwortet das Ihre Frage, bitte?

  • Wenn sie Ihnen zu klein sind, wie gesagt, das Angebot steht zur Verfügung.
  • Sie können sie auch 1 zu 1 ausdrucken.
  • Die Frage war, falls Sie wirklich zwei Stunden am Stück machen, also 120 Minuten durch, ob es möglich wäre, nach einer Stunde zumindest mal eine Pause einzulegen, weil es sehr schwer ist, sich so lange zu konzentrieren.
  • Ich werde das abhängig machen vom Mehrheitswunsch.
  • Wenn die Mehrheit so entscheidet, können wir das so machen.
  • Ansonsten bitte ich Sie, das demokratische Votum zu akzeptieren.

Einverstanden?

  • Gut.
  • Frau Schöning, ja.
  • Frau Schöning spricht gerade das Angebot der Unterrichtsmitschau an, was ich hier nochmal wirklich ausgesprochen lobend erwähnen möchte.
  • Das ist eine tolle Sache.
  • Wenn Sie zu einem Zeitpunkt mal nicht kommen können, wird jede Sitzung mitgefilmt. Zu jeder Sitzung werden die gezeigten Folien angeboten.
  • Der Mitschnitt ist sogar thematisch gegliedert von jeder einzelnen Sitzung.
  • Das ist wirklich eine spitzen Sache, die hier angeboten wird.
  • Und dafür möchte ich meinen Kollegen hier auch mal herzlich danken, in aller Öffentlichkeit.
  • Und ich denke, das ist einen Applaus wert.
  • Gut, weitere organisatorische Fragen. Ich sehe da hinten noch eine Hand.

Den Link, und das wird beim nächsten Mal genau vorgestellt werden.

  • Zunächst einmal finden Sie die Unterrichtsmitschau generell unter http://mitschau.lmu.edu. Und dort sind die Veranstaltungen gegliedert, Sie schauen einfach unter Sommersemester 07 Vorlesungen und finden dort meine Vorlesung, die ich Ihnen jetzt hier präsentiere, und die von Kollegen.
  • Aber der genaue Link wird beim nächsten Mal im Zuge der Präsentation der Unterrichtsmitschau demonstriert.
  • Durch die Unterrichtsmitschau selbst.

Gut, die organisatorischen Fragen scheinen geklärt zu sein. Dann würde ich sagen, gehen wir direkt zu den Inhalten?

  • Ja, Frau Schöning.
  • Ihre Kommilitonin hat gerade noch eine Frage gestellt hinsichtlich der eventuellen Tutorien-Unterstützung, die diese Vorlesung begleiten wird.
  • Ich habe Ihnen beim letzten Mal angekündigt, das dauert noch ein, zwei Wochen, bis das definitiv ist.
  • Ich bin sehr optimistisch, Ihnen nächste Woche schon Bescheid darüber geben zu können, ob innerhalb dieses 2-Stunden-Fensters, was ich hier anbiete, wie Sie wissen, noch beispielsweise 20 Minuten oder so eine Aufgabe gerechnet wird, die zu dem jeweiligen Vorlesungsthema, was gerade gehalten wurde, passt.
  • Beim nächsten Mal sage ich Ihnen definitiv, ob, wann und wie und durch wen das eventuell angeboten wird.
  • Bis dahin brauchen die Uni-Gremien noch Zeit, bis die Genehmigung durch ist.
  • Ja, aber es wäre sicherlich eine gute Sache.
  • Danke.
  • So.
  • Sehen Sie die Überblicksfolie, die Sie in noch lesbarerer Form ja selbst im Handout vorne drin haben.
  • Ich möchte Ihnen zeigen, wo genau wir uns zurzeit befinden.
  • Wir befinden uns hier noch, das ist ja das erste Kästchen, das Handout Kapitel 4, Tests als Datenerhebungsverfahren.
  • Unterpunkt, da sind wir stehen geblieben, Arten von Tests.
  • Diesen Unterpunkt werden wir heute abhandeln können und dann schon zur nächsten größeren thematischen Einheit vordringen können.
  • Das sind nämlich die Testbestandteile, Test-Items und Test-Gestaltung.
  • Insbesondere die Unterpunkte sprachliche Gestaltung von Items und Antwortmodi werden uns heute schwerpunktmäßig beschäftigen.
  • Darüber hinaus aber auch schon, was den Unterpunkt Item-Analyse angeht, Begriffe wie Item-Schwierigkeit, Trendschärfe und Fortfolgende.
  • Das ist das, was ich heute gerne mit Ihnen durchsprechen möchte.
  • Sie erinnern sich an die Arten von Tests, wie beispielsweise Herr Borz und Herr Lienert, unterschiedliche Testarten kategorisiert haben.
  • Diese Kategorisierung haben wir beim letzten Mal nicht komplett durchführen können, sodass wir heute daran weitermachen und nahtlos daran anschließen.
  • Wir hatten zunächst gesagt, dass dies eine Wiederholung ist; es gibt zunächst einmal Persönlichkeitstests.
  • Das sind Tests, in denen Persönlichkeitsmerkmale bzw.
  • Charaktermerkmale wie Eigenschaften, Motive, Interessen, Einstellungen usw.
  • erfasst werden.
  • Dabei spielen objektive Beurteilungsmaßstäbe keine Rolle.
  • Das heißt, es gibt keinen vorgefertigten Beurteilungsmaßstab.
  • Es gibt kein definitives Richtig und Falsch, wie das beispielsweise bei Intelligenztests der Fall ist oder Leistungstests generell.
  • Das ist eine wichtige Testklasse.
  • Ich zeige Ihnen auch gleich mal ein Demo-Beispiel von einem Persönlichkeitstest.
  • Jetzt kann man weiter kategorisieren.
  • Bei Leistungstests, das war ein Intelligenztest, das war die Folie davor. Die kann man jetzt in unterschiedlicher Art und Weise angehen und kategorisieren.
  • Man kann zunächst einmal bei Leistungstests, Speedtests, im deutschsprachigen Bereich auch Schnelligkeits- oder Geschwindigkeitstests genannt, sich anschauen.
  • Und man stellt fest, bei den Leistungs- oder Speedtests kommen eigentlich nur recht einfache Aufgaben vor.
  • Deshalb steht hier, die enthalten relativ leichte Aufgaben in einer Anzahl, die von praktisch keinem Probanden, PB heißt bei mir immer Probanden, innerhalb der knapp bemessenen vorgegebenen Testzeit alle beantwortet werden können.
  • Wenn Sie schon mal einen Leistungstest gemacht haben, werden Sie gedacht haben, in den ein, zwei Minuten Zeit, da komme ich ja mit meinen Aufgaben gar nicht durch.
  • Ich schaffe es gar nicht, alle Items zu bearbeiten.
  • Aber dafür sind sie ziemlich leicht auszufüllen.
  • Das spricht dafür, dass es sich um einen Speedtest handelte.
  • Denn die Differenzierung zwischen den Versuchspersonen wird nur durch die Begrenzung der Bearbeitungszeit erreicht, und das ist hier wichtig: Je schneller die Aufgaben richtig gelöst werden, desto höher ist der Testwert.
  • Das bedeutet, wenn man bei diesen leichten Aufgaben, wie beispielsweise in einer Buchstabenkolonie, die 'P's und die 'D's durchstreicht, wäre das eine recht stumpfsinnige Aufgabe, die im Prinzip auch ein Grundschüler gut bewältigen kann.
  • Aber die Aufgabe wird dadurch schwierig, dass man ihnen ein Zeitlimit setzt und sagt, sie sollen innerhalb von einer Minute alle 'P's und 'D's in dieser willkürlichen Buchstaben-Aneinanderreihung finden.
  • Durch das Zeitlimit, also durch die Speed-Komponente, wird es schwierig und eine Herausforderung.
  • Wenn man die Speed-Komponente nicht hätte, wäre das kein Leistungstest mehr, weil fast jeder Mensch, also auch Grundschüler, die Buchstaben kennen, das ohne Probleme lösen könnte.
  • Das sind Speed-Tests.
  • Es gibt jetzt, wie Sie sich vorstellen können, noch einen Kontrast dazu.
  • Das sind die Power-Tests, auch Deutsch Niveau-Tests genannt.
  • Sie enthalten jetzt Aufgaben, und die Aufgaben sind, wie Sie wissen, vom letzten Mal immer Test-Items, die in ihrem Schwierigkeitsgrad kontinuierlich so weit ansteigen, dass die letzten Aufgaben trotz fehlender oder großzügig bemessener Zeitbegrenzung nur von sehr wenigen Probanden beantwortet werden können.
  • Das heißt, hier ist es so: Bei Powertests hat man üblicherweise keine Zeitbegrenzung.
  • Die meisten Intelligenztestaufgaben sind aber eine Mischung aus Speed und Power, muss man dazu sagen.
  • Aber wir schauen uns jetzt mal die Powertests in Reinkultur an, hier zu Differenzierungszwecken.
  • Die Aufgaben werden immer schwieriger.
  • Und dadurch ergibt sich die Schwierigkeit, nicht durch die Zeitbegrenzung.
  • Mit derartigen Verfahren wird primär das intellektuelle Niveau oder die Denkkraft hier mit Power übersetzt ermittelt.
  • Die meisten Tests sind Mischformen, da die Aufgabenschwierigkeiten oft stark streuen und eine Zeitbegrenzung vorliegt.
  • Was Aufgabenschwierigkeit ist, ist ein Vorgriff.
  • Da kommen wir hoffentlich noch im Laufe der heutigen Sitzung darauf zu sprechen, was Aufgabenschwierigkeit genau ist und wie das statistisch ausgedrückt wird.
  • Also, das ist eine wichtige Unterscheidung in diesem Leistungstestbereich: Speedtest, Powertest.
  • Dann kann man Tests differenzieren nach der Anzahl der zu erfassenden Persönlichkeits- oder Leistungsmerkmale.
  • Und wir sehen zunächst mal, es gibt eindimensionale Tests. Das ist eine Gruppe, und es gibt mehrdimensionale Tests.

Was macht den Unterschied aus?

  • Die eindimensionalen Tests messen nur ein Merkmal bzw.
  • ein Konstrukt.
  • Sie erinnern sich an Konstrukterfassungen vom letzten Mal.
  • Über Ich oder Persönlichkeit oder Extraversion hat niemand je gesehen.
  • Das ist ein Konstrukt.
  • Wenn nur eins erfasst wird, ist es ein eindimensionaler Test.
  • Üblicherweise erfasse ich ein Konstrukt, das an die letzte Veranstaltung mit einer Skala anknüpft.
  • Sie erinnern sich, eine Testskala misst üblicherweise ein Konstrukt.
  • Mehrdimensionale Tests sind gegeben, wenn ein Test mehr als ein Merkmal erfasst.
  • Die klassische Testtheorie, das ist eine große Testtheorie, die wir vielleicht in, ich schätze, zwei bis drei Wochen hier im Rahmen dieser Vorlesung thematisieren werden, befasst sich nur mit eindimensionalen Tests, sodass die einzelnen Dimensionen mehrdimensionaler Tests separat zu analysieren sind.

Und wie kann ich das machen?

Haben Sie eine Idee?

  • Beim letzten Mal haben wir schon ein paar Grundbegriffe rund ums Testen definiert.

Wie kann ich das machen, wenn ich jetzt mehrere Konstrukte erfassen will?

Also, was brauche ich auf jeden Fall, wenn ich mehrere Konstrukte erfassen will?

Mehrere Skalen, genau, und wenn ich mehrere Skalen kombiniere, wie nenne ich das dann?

  • Testbatterie, exakt.
  • Wunderbar, das sieht schon gut aus.
  • Und das Ganze kann ich herausfinden, ob ein Test ein- oder mehrdimensional ist, durch eine Dimensionalitätsüberprüfung.
  • Ja, und hier steht es jetzt schon, zur Überprüfung der Dimensionalität eines Testverfahrens bietet sich ein statistisches Verfahren an, das Sie garantiert alle schon kennen, das ist die Faktorenanalyse.
  • Hier ist die Faktorenanalyse.
  • Üblicherweise nicht so heiß beliebt bei den Studierenden, aber es ist ein tolles Verfahren und wird im Rahmen der Testkonstruktion häufig verwendet.
  • Es lohnt sich, damit auseinanderzusetzen, und wir werden das hier im Rahmen dieser Veranstaltung auch ein wenig tun.
  • Also, die Faktoranalyse liefert mir Erkenntnisse darüber, ob mein Test ein- oder mehrdimensional ist.
  • Gut.
  • Dann kann ich Tests kategorisieren.
  • Nach dem Ausmaß des erforderlichen subjektiven Urteils des Auswerters. Erinnern Sie sich an eine Testklasse vom letzten Mal, wo wir gesagt haben, dass es ein bisschen schwierig ist mit dieser Subjektivität, die damit einhergeht.

Welche waren das, bitte?

Wissen Sie es?

  • Bestimmt.

Ja, oder Sie da hinten?

Niemand?

Bitte?

  • TAT.

Zu welcher Gruppe gehört der TAT?

Von welcher Testklasse ist das?

  • Projektiv.
  • Projektive Tests, wunderbar, richtig, genau.
  • Bei denen war es schwierig.
  • Mit der Objektivität, weil eine gewisse Subjektivität mit dem Auswertungsprozess einhergeht, weshalb man schon als Psychologe da ein bisschen kritisch hinschauen muss, wird da sauber gearbeitet.

Ist das Verfahren so, dass wir sagen können, es genügt unseren Gütekriterien?

  • Also, objektive Tests sind gegeben, wenn das Testergebnis rein mechanisch gewonnen werden kann.
  • Das heißt, wenn es praktisch keinen subjektiven Interpretationsspielraum für den Testauswerter gibt.
  • Sie können es so formulieren, wenn die Testauswertung so stark standardisiert ist, dass dem individuellen Testauswerter die Hände gebunden sind hinsichtlich seiner eigenen Meinung.
  • Oder aber nicht-objektive Tests, man könnte nicht-objektiv jetzt auch mit subjektiv übersetzen, hätte ich auch kein Problem damit.
  • Nämlich, wenn ein subjektives Urteil des Auswerters eine Rolle spielt, wie dies etwa bei projektiven Tests der Fall ist.
  • Da sehen Sie es nochmal als Wiederholung.
  • Unter anderem deshalb sind projektive Tests so in der Kritik.

So, dann können wir des Weiteren Tests kategorisieren.

  • Nach der Art der Durchführung, das ist auch wichtig.
  • In der Praxis, weil das viel mit Kosten zu tun hat.
  • Wir haben Individualtests oder Gruppentests.
  • Das bezieht sich darauf, in welchem Modus die durchgeführt werden können.
  • Individualtests sind Tests, die lediglich einzeln mit den Versuchspersonen durchgeführt werden können, zum Beispiel der HVR.
  • Der HVR, das steht, Tests haben häufig eine ganz kryptische Abkürzung und der HVR ist ein gutes Beispiel dafür.
  • Der steht für Hamburg Wechsler Intelligenztest für Erwachsene.
  • Also, H, Hamburg, Wechsler, Intelligenztest, Erwachsene, E, minus R, R heißt überarbeitet, also revidiert.
  • Das ist ein Intelligenztest, der kann nur eins zu eins gemacht werden.
  • Also, wenn Sie den beispielsweise mit mir machen wollten, hätten Sie den Testkoffer. Ich zeige Ihnen gleich mal den Testkoffer und mich als Probanden, und wir würden den quasi annähernd im Dialog lösen.
  • Und das dauert ungefähr eine Stunde bis anderthalb Stunden.
  • Das heißt, es ist recht teuer.
  • Sie müssen einen Psychologen darauf ansetzen. Es geht mit Aufwand einher.
  • Und der kriegt dann nachher nur eine Diagnose von einer Person.
  • Und alle projektiven Tests kann man natürlich auch nur individuell machen.
  • Ich denke, der Grund ist allen eindeutig.

Wohin gegen Gruppentests?

  • Tests sind die auch in Gruppen durchführbar sind, was besonders in institutioneller Diagnostik erheblich zeitökonomischer ist.
  • Und zeitökonomisch heißt in dem Fall Zeit ist Geld, also auch kosteneffizienter.

Haben Sie ein intuitives Beispiel?

  • Fragebogen beispielsweise, genau.

Sie können im Persönlichkeitstest, angenommen Sie arbeiten hier in München als Personalauswählerin in einem hier ansässigen Großunternehmen. Sie haben natürlich viel, viel mehr Bewerberinnen und Bewerber als Stellen. Sie wissen beispielsweise, dass gewisse Persönlichkeitsmerkmale wichtig für den Erfolg in dieser ausgeschriebenen Stelle sind. Könnten Sie beispielsweise im Persönlichkeitstest alle diejenigen Leute machen lassen, die in die engere Auswahl kommen für diese Stelle?

  • Und das können Sie auch in einem Raum machen, sieht dann aus wie eine Klausur, die machen sie parallel.
  • Das heißt, Sie brauchen eine Psychologin oder eine Aufsichtskraft, die ein bis zwei Stunden, je nachdem wie lange das Verfahren dauert, da Aufsicht macht und haben dann danach 30 Persönlichkeitsdiagnosen.
  • Das ist also deutlich ökonomischer.
  • Gut, es gibt aber auch - muss ich dazu sagen - nicht, dass hier ein falscher Eindruck entsteht, es gibt auch Intelligenztests, die man als Gruppentest durchführen kann.
  • Bitte.
  • Es gibt ja auch Tests, um Teamverhalten zu testen, in Form dessen, dass man jetzt eine kleine Gruppe bildet.
  • Teamverhalten, ja.
  • Teamverhalten, ja, das geht auch, klar.

Also meinen Sie beispielsweise in Assessment-Centern?

  • Assessment-Center sind eine besondere Art der Personalauswahl, wo eine Mischung gemacht wird zwischen der klassischen Testdiagnostik, die Sie hier sehen, und interaktionsorientierten Beobachtungsverfahren.
  • Häufig werden in Assessment-Centern Persönlichkeitstests kombiniert mit beispielsweise Rollenspielen, Gruppendiskussionen und so weiter.
  • Simulation von Verkaufsgesprächen, wenn es darum geht, dass die Personen, die ausgewählt werden, später Verkäufer werden sollten, und so weiter und so fort.
  • Ist auch eine hoch umstrittene Form der Personalauswahl, kann aber gut sein, wenn gut entwickelt und wird Ihnen noch in größerer Tiefe nahegebracht werden im Rahmen der Arbeits- und Organisationspsychologie.
  • Bitte.
  • Ich bringe das gar nicht so zusammen, wie jetzt eigentlich Interviews eingeordnet werden.

Das hat einen Test gar nicht zu tun, oder?

  • Zum Beispiel, ein semi-strukturiertes Interview ist kein Test.
  • Ihre Kommilitonin fragt, wie Interviews, insbesondere teilstandardisierte, und die nennt man dann häufig semi-standardisierte Interviews, einzuordnen sind in den Bereich der Testtheorien.
  • Ich kann das so beantworten. Die Grundlogik, also die diagnostische Grundlogik, die diesen Verfahren zugrunde liegt, ist dieselbe wie die von den standardisierten Testverfahren.
  • Es geht immer darum, sozusagen über die Item Responses, also wie die Person auf die Fragen, die die Stimuli sind, reagiert, und daraus Rückschlüsse auf die Merkmalsausprägungen zu ziehen, wie wir es beim letzten Mal besprochen haben.
  • Üblicherweise sind diese Interviewfragen aber nicht so stark standardisierbar.
  • Und manchmal auch nicht quantifizierbar, sodass das qualitative Diagnostik ist.
  • Wir brauchen aber als Psychologen beides.
  • Es kommt darauf an, in welchem Kontext wir uns befinden.
  • Wir werden im Verlauf der Vorlesung noch darüber sprechen, aber soweit es gerade zum Thema passt.

Wann, glauben Sie, sind standardisierte Testverfahren die Methode der Wahl bei der Diagnostik?

  • Oder machen wir es mal so: Ich stelle die Frage ein bisschen anders herum formuliert.
  • Sie interessieren sich als Forscherin für ein gewisses Thema.
  • Sagen wir, Sie sind die erste Person, die sich für emotionale Intelligenz interessiert.
  • Das waren jetzt schon ein paar Leute vor Ihnen, aber tun wir mal so, dazu gäbe es noch nichts.
  • Und Sie denken, ja Mensch, das akademische Intelligenzkonzept ist schön und gut.
  • Aber es muss irgendwie noch mehr geben, noch mehr Leistungsfähigkeiten, beispielsweise.
  • Und Sie denken sich, ja, vielleicht gibt es so etwas wie intuitive oder emotionale Intelligenz oder so, Kommunikationsintelligenz oder irgendwie so etwas in der Art.
  • Und Sie wollen das jetzt empirisch erforschen.

Welcher Mittel könnten Sie sich dann bedienen?

Ja, wie kommen Sie, Sie sind Forscherin, Sie arbeiten also nach angesehenen Standards, was können Sie tun?

  • Zu dem Zeitpunkt wird es zu Ihrem Konstrukt dieser emotionalen Intelligenz noch kein Testverfahren geben, weil Sie die erste Person sind, die sich darum bemüht.
  • Das heißt, Sie müssen erst einmal ein Verfahren entwickeln, um herauszufinden, was überhaupt dazugehört.
  • Also, wenn Sie am Anfang der Entwicklung stehen oder sich mit Themen beschäftigen, die nicht gut erforscht sind, bietet es sich an - und das ist jetzt die Brücke zu Ihrer Frage - erst einmal qualitativ zu forschen.
  • Qualitativ bedeutet, Interviews zu führen.
  • Erst einmal nicht mit Daten und Zahlen arbeiten, sondern zunächst Interviews führen, um zu sehen, wie mein Konstrukt, die emotionale Intelligenz, überhaupt zu definieren ist.

Was ist es?

Was ist es nicht?

Wie kann man das ansatzweise diagnostizieren?

  • Und so, peu à peu, eine Eingrenzung ihres Forschungsthemas erreichen, sodass irgendwann mal eine etablierte Konstruktdefinition da ist.
  • Ein anderer Forscher könnte sich vielleicht auch dafür interessieren. Er hat einmal einen Fragebogen dazu entwickelt. Sie überprüfen ihn, ergänzen ihn, verbessern ihn, normieren ihn neu und sobald also die klare Antwort auf die Frage vorliegt, je weniger wir über einen Sachverhalt wissen, desto eher müssen wir qualitativ arbeiten, um zunächst einmal eine Idee dafür zu bekommen, was wir eigentlich auf der Spur sind, was das Konstrukt ausmacht. Je besser und etablierter das Wissen schon ist. Beispielsweise gibt es sehr viel etabliertes Wissen im Bereich der Persönlichkeitspsychologie, im Bereich der Persönlichkeitsbeschreibung. Also wie es unsere Persönlichkeitsstruktur erfasst oder beschreibt.
  • Da haben sich jetzt seit ungefähr 100 Jahren kluge Köpfe Gedanken gemacht.
  • Das heißt, das ist so gut erforscht, dass wir in diesem Persönlichkeitsbereich im engeren Sinne davon ausgehen können, dass wir nichts verpassen, wenn wir mit Fragebögen diagnostizieren, die standardisiert sind und quantitativ vorgehen.
  • Aber wir brauchen als Psychologen grundsätzlich beide Methoden.
  • Was ich dazu noch sagen möchte, ist, man findet häufig wie die Schulen Streitigkeiten innerhalb der Psychologie, wo die eine Schule der anderen nichts abgewinnen kann und wechselseitig, wie es beispielsweise bei analytisch-tiefenpsychologischen Schulen so ist und der kognitiv-verhaltenstherapeutischen. Die lassen in der Regel auch keine Konkurrenz daneben sich dulden, also sie dulden das nicht, also machen sich wechselseitig auch schlecht, was zu einem schlechten Klima innerhalb der Psychologenschaft führt.
  • Das ist eine Sache für sich, hat auch historische Gründe.
  • Damit einher geht auch dieser Richtungsstreit im methodischen Bereich: qualitativ versus quantitativ.
  • Wir machen hier in der Vorlesung in erster Linie die quantitative Richtung.
  • Ich möchte Ihnen aber trotzdem nahelegen, sich auch mit qualitativen Datenerhebungs- und Auswertungsmechanismen zu beschäftigen, weil das einfach dazugehört, um ein vollumfängliches diagnostisches Bild zu haben.
  • Wir brauchen beides.
  • Lassen Sie sich da nicht von den unterschiedlichen Therapieschulen oder von unterschiedlichen methodischen Richtungsstreitigkeiten beeinflussen, denn die gibt es auch und sie befassen sich genau mit diesem Quantitativ-Werderus-Qualitativ-Streit.
  • Lassen sich dann nicht irgendwie auf eine Seite ziehen, man braucht beides.
  • Üblicherweise möchte ich aber auch dazu sagen, dass der psychologische Forschungs-Mainstream sich im quantitativen Bereich bewegt.
  • Wenn Sie später Forscherin werden wollen und Artikel in angesehenen Journals publizieren, ist es üblicherweise so, dass Sie mit der quantitativen Methodik mehr Erfolg haben als mit der qualitativen.
  • Das ist, wie gesagt, dieser Richtungsstrahl, der sich dann auch dort niederlegt.
  • Wie gesagt, mein Tipp: Befassen Sie sich mit beidem, dann sind Sie auf einer ganz sicheren Seite.

So, noch eine weitere Frage, ja?

Darf ich trotzdem noch einmal nachfragen, also wenn ich jetzt konkret zum Beispiel mit den Erwachsenen dieses Adult Attachment Interview durchführe, als Beispiel, ja?

  • Ja.

Dann darf ich nicht sagen, ich mache jetzt mit Ihnen einen Test, oder ist es ein Test?

  • Da kann man es nicht sagen.
  • Bei dem Adult Attachment Interview, also die Frage Ihrer Kommilitonin bezieht auf ein Verfahren, was Bindungsverhalten bei Erwachsenen misst.
  • Das ist nicht standardisiert in dem Sinne, völlig durchstandardisiert wie ein klassischer Test, den Sie gleich hier noch kennenlernen werden.
  • Man kann dann schon auch Test sagen, wenn es einigermaßen auf wissenschaftlicher Grundlage fußt, und das ist bei dem Verfahren, was Sie genannt haben, der Fall.
  • Das ist in Ordnung.
  • Okay.
  • Gehen wir weiter im Text.
  • Also, man kann weiterhin Tests differenzieren nach der Art der Aufgabenbeantwortung.

Es gibt einerseits gebundene Aufgabenbeantwortung und freie Aufgabenbeantwortung.

  • Das passt jetzt wunderbar in das eben Gesagte, weshalb ich damit auch gleich weitermachen wollte.
  • Sie sehen das.
  • Die gebundene Aufgabenbeantwortung liegt vor, wenn bei einer Aufgabe bereits Antwortalternativen vorgegeben sind.
  • Beispielsweise kreuzen sie an von 1 bis 5 oder von starker Ablehnung bis starke Zustimmung.
  • Und bei einer freien Beantwortung, wenn der Proband selbst eine Antwort auf eine Frage oder Aufgabenstellung finden muss, das ist ganz ähnlich, wenn auch nicht bedeutungsgleich, zu sehen mit der Differenzierung nach quantitativen und qualitativen Testverfahren.
  • Interviews werden ja qualitativ.
  • Sie stellen beispielsweise eine Frage, und die Antwort ist dann in freier, also ungebundener Aufgabenform zu beantworten.
  • Wunderbar, es passt ganz gut dazu.
  • So, jetzt wollte ich Ihnen aber das Verfahren mal zeigen.
  • Ich zeige Ihnen hiermit den NEO-PR.
  • Das ist eines der international angesehensten Persönlichkeitstestverfahren.
  • Ich sehe schon jemanden, der kennt den schon.
  • Die Studierenden, die bei mir im Experimentalpraktikum waren, kennen den schon so ziemlich aus dem FF.
  • Deswegen grins ich.
  • So sieht das aus.
  • Ich mache es gleich nochmal auf, das Köfferchen, was darin ist.
  • Zunächst mal generell.

Was besteht aus Testmaterialien?

  • Und da gibt es bestimmte Bestandteile davon.
  • Zunächst einmal gibt es ein Testmanual.
  • Ein Manual ist nichts anderes als ein Handbuch, wie Sie wissen.
  • Hoffentlich sind alle relevanten Gütekriterien und entstehungsgeschichtlichen Ausführungen enthalten, die das Verfahren ausmachen.
  • Das heißt, es wird dort beschrieben, wie der Test entstanden ist und welche wissenschaftlichen Grundlagen zugrunde liegen, sodass nachvollziehbar und überprüfbar ist, mit welchem Verfahren Sie hier diagnostizieren.
  • Dann finden Sie darin Durchführungs- und Interpretationsanweisungen sowie Normen.
  • Diese sind wichtig, um den erhobenen Testdaten dann auch einen Sinn zu verleihen.
  • Das Testmaterial sind üblicherweise Stimulus- und Reaktionsmaterial, wie Sie wissen.
  • Also hier im Beispiel, und das mache ich jetzt mal auf und zeige es Ihnen.
  • Also, wenn Sie es aufmachen, das hier ist ein recht schöner Testkoffer, unter anderem deshalb zeige ich den.
  • Sie finden hier zunächst mal ein Testmanual, das ist das Handbuch, wo alles drin steht.
  • Hier in dem Fall steht wirklich so ziemlich alles drin, was man wissen muss.
  • Dann finden Sie Auswertungsmaterialien.
  • Hier finden Sie Fragebogenmaterial.
  • Das ist hier in hochwertiger Testform.
  • Ich gebe es auch gleich mal rum, damit Sie es alle auch sehen können.
  • Hier finden Sie die Items hintereinander weg.
  • Vorne finden Sie noch eine Instruktion, da kommen wir gleich noch darauf zu sprechen.
  • Oder am besten gleich jetzt, dann kann ich es Ihnen nämlich mal als Beispiel vorlesen.
  • Sie finden also das Stimulus- und Reaktionsmaterial.
  • Das wären hier im Beispiel die Items 1 bis 240, denn so viele Items hat der Neo PR.
  • Das geht los mit dem Item, oder ich nehme mal eins, was hier in der Liste steht.
  • Die meisten Menschen, die mir begegnen, sind mir wirklich sympathisch.
  • Und ich habe die Möglichkeit, darauf zu antworten im Antwortmodus von starker Ablehnung bis starker Zustimmung, fünfstufige Rating-Skala.
  • Rating-Skala, kommen wir gleich noch darauf.
  • Oder gehen wir mal hier willkürlich auf Item 230.
  • Man könnte mich in gewisser Weise als arbeitssüchtig bezeichnen.
  • Und auch das haben Sie dann möglichst subjektiv, stimmig von starker Ablehnung bis starker Zustimmung zu beurteilen.
  • Für sich selbst.
  • Dass es für Sie selbst ist, erkennt man daran, dass hier steht Form S.
  • Sehen Sie hier vorne, Form S heißt Selbstbeurteilung oder Selbstbeschreibungsform.
  • Hier machen Sie Angaben über sich selbst.
  • Und das gibt es auch als, Sie werden unschwer darauf kommen, was dann Form F heißt.
  • Das gibt es dann eben auch als Form F und da steht dann halt drin, dass er oder sie selten Furcht oder Angst empfindet.
  • Das ist dann in der dritten Person, wo Sie eine Ihnen bekannte Person einschätzen.
  • Ja, und man kann natürlich dann nachher die Ergebnisse, die zwischen der Selbstbeschreibungsform und der Fremdbeschreibungsform herauskommen, korrelieren und gucken, inwiefern Sie selbst und Leute, die Sie kennen, eine ähnliche Einschätzung zu Ihrer Person haben.

Und was schätzen Sie, wie hoch ist üblicherweise die Korrelation?

Bei diesen Studien selbst fremd?

Ja, bitte?

  • Punkt 50.
  • Richtig, genau.
  • Punkt 50 ist genau der übliche Wert, den man…
  • Punkt 50.
  • Also es ist nicht wahnsinnig hoch, aber auch nicht wahnsinnig niedrig.
  • Also irgendwo im mittleren Bereich einzuschätzen.
  • Gut.
  • Stimulus- und Reaktionsmaterial habe ich gerade benannt.
  • Sie dürfen gerne noch etwas fragen.

Form R und Form F und Form S laufen nur beim VOP, oder ist das grundsätzlich so?

  • Das ist die Form, also die Selbst- und Fremdbeurteilungsform, die man mittlerweile bei den meisten Testverfahren findet, die jetzt in letzter Zeit entwickelt wurden.
  • Das hat einen bestimmten Grund.

Können Sie sich vorstellen, weshalb man eine Fremdform haben sollte? Also die Selbstform ist der Klassiker, sie ist immer dabei. Warum ist es vorteilhaft, eine Fremdform zu haben?

Bitte.

Zur Überprüfung nochmal, oder?

  • Zur Überprüfung der Aussagen, okay.

In welchem Kontext ist die Überprüfung der Einschätzung des Selbst, sich selbst beurteilenden, von Interesse?

  • Bei der Personalauswahl.
  • Bei der Personalauswahl, natürlich.
  • Sie wissen ja, beim letzten Mal haben wir es, glaube ich, schon angesprochen. Tests kann man verfälschen.

Wie sieht es aus mit Intelligenztests, wie kann ich die verfälschen?

  • Höchstens ins Negative.
  • Höchstens ins Negative.
  • Also, ich kann mich dümmer stellen, als ich bin, das funktioniert natürlich.
  • Ich kann mich allerdings nicht intelligenter stellen, als ich bin.
  • Sich verstellen heißt auch Faking.
  • Faking good heißt, sich besser darzustellen.
  • Faking bad heißt, sich sozusagen schlechter darzustellen.
  • Also, Faking gut im Intelligenzbereich oder im Leistungsbereich geht nicht.

Wie sieht's aus im Persönlichkeitsbereich?

  • Sie wissen ja, Intelligenz und Leistung sind eine Testklasse, Persönlichkeit ist eine andere und für die gelten jetzt wieder andere Regeln.

Wie sieht's jetzt mit Faking Good und Faking Bad im Persönlichkeitsbereich aus?

Bitte?

Das heißt, es geht beides?

Richtig, genau.

  • Im Persönlichkeitsbereich ist sowohl Faking Good als auch Faking Bad möglich.
  • Und das heißt, wenn Sie sich irgendwo bewerben und da ist ja eine Stellenausschreibung üblicherweise gegeben, können Sie intuitiv erahnen, was die Firma, die jetzt ausschreibt, an Persönlichkeitsmerkmalen von der Person haben möchte, die Sie einstellen. Sie können Hypothesen bilden und beispielsweise feststellen, dass Extraversion sehr gewünscht ist und Gewissenhaftigkeit sehr gewünscht ist. Sie könnten dementsprechend versuchen, anhand Ihrer intuitiven Hypothesen ein wenig in Ihre Selbstbeschreibung einfließen zu lassen.
  • Das Schwierige für den Personalauswähler ist, er hat ja keine Möglichkeit, das direkt zu überprüfen.
  • Aber was glauben Sie, was passiert, wenn man den Leuten im Rahmen eines Assessment Centers sagt, bitte erstellen Sie hier Ihre Selbstbeschreibung, aber nachher werden wir die Beobachter, die Sie in verschiedenen Interaktionssituationen beobachtet haben, auch bitten, eine Fremdeinschätzung über Sie abzugeben.
  • Und wenn wir dann nachher zu große Diskrepanzen feststellen, dann müssen wir darüber reden.

Was glauben Sie, wie das wirkt?

  • Es wirkt wahrscheinlich validitätserhöhend, was die Selbstbeschreibung angeht.
  • Und das wird häufig gemacht, und deshalb ist es häufig, gerade bei berufsbezogenen Verfahren oder Verfahren, die im beruflichen Kontext angewendet werden, mittlerweile oft eine Fremdbeschreibungsmöglichkeit dabei, allein um ein bisschen diese Faking-Good- und Faking-Bad-Möglichkeit, die mit Persönlichkeitstests einhergeht, zumindest zu reduzieren.
  • Weil niemand möchte nachher in den Rechtfertigungszwang geraten, wenn dann das Beurteilergremium neutralerweise zu einem ganz anderen Urteil kommt als sie selbst.
  • Gut, das heißt, ich lasse hier mal ein paar Bögen herumgehen.
  • Bitte geben Sie mir die am Ende der Veranstaltung wieder mit.

Bitte schön.

  • So, das heißt, wir haben die Punkte besprochen, aber natürlich noch nicht alles.
  • Es geht noch weiter.
  • Sie werden sich fragen, wo die Probanden in dem Fall von den Test-Items, die jetzt hier vorgegeben sind, sie sehen das jetzt nicht.
  • Sie wissen, man kann von 1 bis 5 ankreuzen, aber man kreuzt jetzt nicht hier in diesem Bogen an.
  • Das habe ich bewusst eben noch nicht gesagt.
  • Hier stehen nur die Items, das heißt der Sprachwort laut, hintereinander weg, 240 Stück, und das hat damit zu tun. Das heißt, hier in diese Bögen wird nicht reingeschrieben, sondern die Antworten werden gemacht. So ist es hier beim Neo PIER gelöst, auf diesen Auswertungsfolien.
  • Das sieht aus wie dieses alte Durchschlagpapier, was man heute nicht mehr verwendet.
  • Hat man früher bei Schreibmaschinen verwendet.
  • Ich reiße mal einen Bogen ab.
  • Gebe ich auch gleich mal rum, können Sie sich anschauen.
  • Hier finden Sie jetzt im ultrakleinen Druck hintereinander die 240-mal starke Ablehnung bis starke Zustimmung.
  • Und darauf sollen die Probanden ihre Kreuzchen machen.
  • Auf diese kleinen Zettel.
  • Sie sehen, dass hinten da ist ein Durchschreibpapier drin, und der Vorteil davon ist, dass es damit zu tun hat. Das ist der nächste Punkt hier, man möchte das Ganze ja auch auswerten.
  • Wenn Sie also Persönlichkeitsdiagnostik mit diesem Verfahren betreiben wollen, dann müssen Sie von jedem Probanden 240 Reaktionen, das heißt hier im Fall 240 Kreuzchen, auswerten.
  • Das ist eine ganze Menge.
  • Und um Ihnen das leichter zu machen, hat man hier bereits eine Auswertungshilfe eingebaut.
  • Also der Proband setzt die Kreuzchen und nachdem er das gemacht hat, können Sie das hier am Rand abtrennen. Sie finden hier bereits einen Teil der Auswertung.
  • Sie können dann die Zeilen einfach addieren und kommen so zu den Unterskalen und den Ausprägungen, die diese Person in den Unterskalen des Neo-PRs hat.
  • Das soll es Ihnen erleichtern.
  • Was auch eine Möglichkeit ist, die bei anderen Testverfahren häufig gemacht wird, ist, dass Sie nachher, wenn die Personen die Kreuzchen in die Hefte reinmachen, Auswertungsschablonen haben, die Sie darüberlegen, dann die jeweiligen Zahlenwerte aufschreiben und das nachher zusammenaddieren.
  • Das ist ein weiterer gängiger Weg, um nachher zu einer möglichst ökonomischen Auswertung zu gelangen.
  • Aber im Persönlichkeitsbereich, und das ist fast eine Alleinstellung innerhalb der Psychologie, betreiben üblicherweise die Persönlichkeitspsychologen und alle Leute, die Persönlichkeit messen, den größten diagnostischen Aufwand.
  • Sie können andere Konstrukte mit viel weniger Aufwand diagnostizieren.
  • Also 240 Items, allein das Ausfüllen des Verfahrens dauert ungefähr eine Dreiviertelstunde. Die Auswertung, wenn Sie es von Hand machen, hier mit diesem Modus, kostet auch noch mal eine Viertelstunde bis 20 Minuten.
  • Also, es ist ein relativ hoher Aufwand.
  • Man kann es allerdings auch bei diesem Verfahren mit dem Computer machen.
  • Dann müssen Sie alle Antwortkreuzchen in den Rechner eingeben, und der hilft Ihnen dann, wenn Sie der SPSS-Syntax Herr sind oder Herrin sind. Er hilft Ihnen dabei, das auszuwerten.
  • Also, Sie sehen, es ist ein gewisser Aufwand damit verbunden.
  • Üblicherweise wird also ausgewertet über Kontrollblätter, Lochfolien, Schablonen oder Messgeräte.
  • Und die Durchführungsbestandteile, die zum Test gehören, sind die Testanweisung für den Testleiter.
  • Das ist üblicherweise im Manual niedergeschrieben.
  • Hier sieht es so aus.
  • Und da steht dann jeweils drin, die Bedingungen, die Durchführung und die Auswertung des Tests und wie das funktioniert.
  • Gut.
  • Das heißt, ich gebe nochmal die Folie durch.

Können Sie sich das anschauen?

  • Bitte nicht abreißen.
  • Hier, das hängt zusammen, das löst sich schon ein bisschen auf.
  • Das hat jemand schon aufgemacht.
  • Bitte reißen Sie den Rand nicht ab.
  • Und geben Sie es hier gleich den Personen auch nochmal rüber, sobald sie es durch haben.
  • Ich habe jetzt leider nur noch diese beiden Exemplare.
  • Da, weil der Test stark gefragt ist.
  • Auch in der Anwendung.
  • Und Sie sehen dann, was Sie noch vorfinden. Hier ist noch ein Erläuterungstext für Probanden dabei. Das ist etwas sehr Schönes, sieht auch gut aus.
  • Hier wird den Probanden ihre Rückmeldung erklärt, aber zuvor müssen Sie erstmal sehen, wie die Rückmeldung aussehen könnte.
  • Sie finden hier diese Profilbögen vor. Also, Sie sehen hier oben steht jeweils Neo PR und dann Form S. Wenn jemand die Form S ausgefüllt hat, dann tragen sie die resultierenden Ausprägungen auch bei dieser Form S ein.
  • Und dann ist das hier jetzt für Männer von 16 bis 20 Jahren normiert.
  • Das gilt natürlich für Frauen von 16 bis 20 Jahren.
  • Also für geschlechtsspezifische Gruppen und altersspezifische Gruppen tragen Sie die Ergebnisse dann in diese Profile hier ein.
  • Und dann erhalten Sie etwas, das ein bisschen aussieht wie diese Geräte, die den Herzschlag beim Arzt messen.
  • Es geht meistens ein bisschen rauf und runter.
  • Und da das noch nicht selbsterklärend ist und Sie dem Probanden ein Feedback geben möchten, das ist übrigens eine Möglichkeit, wie Sie Probanden bekommen können, wenn Sie kein Geld haben, um die zu bezahlen. Sie bieten ihnen ein wissenschaftliches Feedback an.
  • Das machen wir in der Persönlichkeitspsychologie häufig, weil das für die Personen, die daran teilnehmen, eine wertvolle Information ist.
  • Schätzen Sie mal, was das kostet, sich so eine beispielsweise eine Neo-PR-basierte Diagnose, also ein Persönlichkeitsbild erstellen zu lassen.
  • Auf dem freien Markt.

Schätzung?

  • 100 Euro ist noch ein bisschen zu viel.
  • Ich schätze, dass Sie 50 bis 80 zahlen müssen.
  • Und das ist für unsere Probanden attraktiv, weil sie es dann umsonst für die Teilnahme bekommen; es dauert ungefähr eine Dreiviertelstunde.
  • Wenn es nur ein Fragebogen ist.
  • Und hier in diesem Persönlichkeitsbild wird noch einmal allgemein verständlich erläutert, was jedes einzelne Konstrukt, das hier erfasst wird, bedeutet. Zum Beispiel im Neurotizismusbereich Ängstlichkeit, Reizbarkeit, Depression, Impulsivität, Verletzlichkeit. Was das alles genau im wahren Leben bedeutet, damit es auch wirklich verständlich ist.
  • Und ich gebe Ihnen, damit Sie das auch noch einmal anschauen können, auch noch ein paar Exemplare rum.
  • Ich bitte darum, damit pfleglich umzugehen, weil ich die noch einsetzen möchte und das Ganze ist auch ziemlich teuer.

Aber zu Anschauungszwecken möchte ich es Ihnen trotzdem gerne geben.

  • Das ist im Wesentlichen das, was in dem Testkoffer drin ist und was da reingehört.
  • Jetzt haben Sie mal ein lebhaftes Beispiel gesehen.
  • In dem Kontext kann ich auch gleich noch sagen, aufgrund eines Missverständnisses beim letzten Mal habe ich nicht explizit eine Einladung ausgesprochen an die Teilnehmenden dieser Vorlesung, bei Interesse teilzunehmen an dem Seminar, was danach folgt und lautet Persönlichkeits- und Intelligenztest.
  • Das möchte ich gerne nachholen.
  • Wenn Sie Interesse daran haben, die Veranstaltung zu besuchen, handelt es sich um ein psychodiagnostisches Basisseminar. Es gibt vier Credit Points und es sind noch Termine frei. Organisatorisch besteht noch Flexibilität. Kommen Sie doch zum Seminar, das um viertel nach vier beginnt und im Raum 1301 stattfindet. Dort können Sie explizit den NEO-PIR und auch andere gute Persönlichkeits- und Intelligenztestverfahren kennenlernen.
  • Ich bin fälschlicherweise davon ausgegangen, dass das Seminar total überlaufen ist.
  • Das ist nicht der Fall.
  • Insofern bei Interesse gerne vorbeikommen.
  • Gut.
  • Machen wir weiter.
  • Die Instruktion für die Probanden ist etwas Wichtiges, was wir noch nicht besprochen haben.
  • Und da möchte ich Ihnen gleich mal ein Beispiel vorlesen.
  • Oder zunächst erläutern, worum es dabei geht, warum das Ganze wichtig ist.
  • Der Proband als solcher ist ja zunächst mal nicht auf die testdiagnostische Situation vorbereitet und hat allerlei Vermutungen darüber, was jetzt gemacht wird oder nicht gemacht wird.
  • Deshalb ist es wichtig, quasi - man könnte es neudeutsch sagen - den Probanden zu briefen, was auf ihn zukommt.
  • Dazu ist die Instruktion da.
  • Das Ziel dieser Instruktion ist eine verständliche Einführung in das Material. Das ist ganz wichtig, dass es verständlich ist. Es muss also für Nichtpsychologen geschrieben sein.
  • Auf die Testsituation soll eingestimmt werden und eine Unterstützung der Motivation des Probanden, an diesem Verfahren teilzunehmen und sich auch selbst zu offenbaren.
  • Gerade im Persönlichkeitsbereich müssen Sie eine gewisse Bereitschaft haben, sich selbst zu offenbaren.
  • Also Dinge preiszugeben, die privater Natur sind.
  • Sie können sich natürlich vorstellen, dass die Menschen in der Regel nur dann bereit sind, sich ein wenig zu offenbaren, wenn sie wissen, dass das Ganze vertraulich behandelt wird und beispielsweise nicht gegen sie verwendet wird.
  • Also 'gegen sie verwendet' ist jetzt ein Extrembeispiel, aber es wird vertraulich behandelt und ist in guten Händen.
  • Das heißt, der Inhalt der Instruktion hat damit zu tun. Es sind technische Anweisungen zur Aufgabenbeantwortung. Also zunächst einmal, wie ist dieses Verfahren seitens des Probanden zu bearbeiten? Es enthält auch den Hinweis, dass keine Daten ausgelassen werden sollen.

Warum?

Was ist das Problem, wenn Personen Items überspringen?

  • Für Sie als Psychologin, die eine Diagnose treffen möchte.

Ideen?

  • Wahrscheinlich sind Sie richtig, wenn Sie eine Idee haben.
  • Es verfälscht ja das Ergebnis.
  • Wenn ich jetzt 97 Prozent beantwortete Fragen habe, weiß ich nicht, wie ich die restlichen drei Prozent behandeln soll.
  • Also, es verfälscht das Ergebnis eventuell, aber Sie haben den Punkt richtig angesprochen.
  • Wenn Personen nicht reagieren, hat das zu tun mit der Grundlogik von Testtheorie, die Sie beim letzten Mal kennengelernt haben.
  • Wir können Diagnosen nur stellen, Sie wissen, idealerweise würden wir den Leuten in den Kopf schauen können.
  • Können wir nicht.
  • Das heißt, wir müssen mit dem Umweg arbeiten.
  • Wir geben den Probanden Items vor, also Stimuli.
  • Diese reagieren auf diese Stimuli, und aus der Reaktion schließe ich zurück auf die Merkmalsausprägung der Probanden.
  • Wenn ich jetzt aber Stimuli vorgebe, also Items vorgebe und die Personen nicht darauf antworten, dann habe ich neudeutsch ein Missing-Value-Problem. Ich habe also keine Antwort, keine Reaktion, und ohne Reaktion des Probanden auf den Stimulus, also auf das Item, kann ich keine Interpretation vornehmen.
  • Das heißt Missing-Values sind für mich als Forscher ganz ungünstig, weil ich keine Aussage machen kann hinsichtlich der Merkmalsausprägung der Person.
  • Deshalb finden Sie häufig im Instruktionsteil die Bitte, alle Items auszufüllen.
  • Selbst wenn Sie glauben, es passt nicht so super jetzt zu Ihrer Situation, entscheiden Sie sich dann bitte für die am nächsten liegende Alternative, um zu verhindern, dass man diese Missing Values hat, weil man ein diagnostisches Problem ohne Antworten hat.
  • Okay, das heißt, es gibt noch weitere Funktionen von der Instruktion.
  • Ach so, Ihre Frage bitte.

Hat sich das schon erledigt?

Ja, das ist eine gute Frage.

  • Also wenn jetzt Psychologen Psychologen auswählen, ob das dann üblich ist, diese Testverfahren zu machen. Meines Wissens nach ist das üblicherweise nicht der Fall, weil gerade im Intelligenzbereich ist es natürlich sinnlos.
  • Bei der Gelegenheit möchte ich ein bisschen Werbung für unsere Testothek machen, die gerade von Herrn Schneewind und mir deutlich verbessert und aktualisiert wird.
  • Dort finden Sie alle gängigen Persönlichkeits- und Intelligenztestverfahren, klinische Testverfahren und so weiter, die Sie als Psychologiestudierende ausleihen können, um Einblicke in die diagnostischen Abläufe zu erhalten, die dort durchgeführt werden.
  • Und wenn Sie beispielsweise den Intelligenztest bereits kennen und ihn zu Hause schon einmal gemacht haben, ist es äußerst sinnlos, Sie damit zu diagnostizieren.
  • Denn dann werden Sie herausragend sein.
  • Vielleicht werden Sie auch so brachial gut, aber wenn Sie vorher die Lösung schon gesehen haben, dann auf jeden Fall.
  • Bitte.
  • Ja, zu ein bisschen Value-Problematik.

Was tue ich denn dann?

  • Also, Sie haben ja jetzt gesagt, das ist ein Problem, das sehe ich ein.

Aber was ist die Lösung?

  • Die Lösung ist, dass sie nach Möglichkeit, also im Persönlichkeitstestbereich, hier wird deswegen, dass ein Item im Neo-PIR-Bereich, fällt mir gerade ein, ist ganz am Ende, ich habe alle Items ausgefüllt.
  • Ja oder nein.
  • Oder ich habe alle Items gewissenhaft ausgefüllt oder alle Items bearbeitet und immer die meiner Meinung nach oder nach bestem Wissen und Gewissen beste Alternative gewählt.
  • Also, nochmal die Leute sensibilisieren, wenn sie ein Item übersprungen haben beim Ausfüllen, nochmal zurückzublättern und das auszufüllen.
  • Das ist eine Möglichkeit.
  • Eine andere Möglichkeit ist, wir reden im Moment ja nur über papierbasierte Diagnostik.
  • Paper and Pencil bedeutet also, sie machen hier ihre Kreuzchen mit Papier und Bleistift.
  • Diese Tests gibt es mittlerweile auch als Computerversion.
  • Und da werden Ihnen die Items nacheinander vorgegeben.
  • Übrigens, wenn Sie das mal sehen wollen, wie das funktioniert, werde ich das nachher um viertel nach vier in dem Seminar vorstellen, wie diese Verfahren am Computer aussehen.
  • Der Computer ermöglicht noch zusätzliche Auswertungsvorteile und Vorgabevorteile, die sehr vorteilhaft sind.
  • Da kann ich…
  • Also, Sie sehen, ich bin einigermaßen begeistert von dieser computergestützten Diagnostik und das wird wirklich die Zukunft sein.
  • Da kann ich kontrollieren, ob die Person bei jedem Item reagiert.
  • Sonst wird das nächste Item gar nicht angezeigt.
  • Wenn da ein Klick fehlt auf die Antwortalternative, kommt das nächste nicht.
  • So kann ich besser kontrollieren, um mit Missing Values umzugehen.

Sollte man fragen, welchen Vorteil es bringt, wenn ich die Leute zwinge, irgendwie eine Antwort zu geben, wenn sie aber eigentlich sich für keins von beiden entscheiden können?

  • Dadurch wird es doch auch verfälscht.
  • Also verfälscht.
  • Also diese Problematik ist am ehesten gegeben bei Antwortmodi, die dichotom sind: Ja oder Nein.
  • Bei den graduellen Ratingsskalen, wie wir es jetzt hier beim Neo PIR kennengelernt haben, wo es einen fünfstufigen Modus gibt, kann ich tendenziell üblicherweise, wenn die Items gut gemacht sind, mich für eine Antwortalternative entscheiden.
  • Über die Vor- und Nachteile der Antwortmodi reden wir gleich noch.
  • Aber das hat damit zu tun.

Eine Frage, und zwar, kann man nicht inzwischen diese Missing Values ganz gut schätzen, zum Beispiel über Regressionen oder EM?

  • Ja, es gibt, wenn Sie größere Umfragen machen und diese nicht computergestützt sind, mit den vielen Vorteilen, wie Sie wissen, sondern wenn Sie die Umfrage mit Papier und Stift durchführen, werden Sie nie vermeiden können, dass ein paar fehlende Werte dabei sind.

Dann stellt sich die Frage, was macht man damit?

  • Und Ihr Kommilitone weist jetzt richtig darauf hin, wenn das sozusagen ein geringer Prozentsatz ist von Missing Values, gibt es statistische Möglichkeiten, aus den vorhandenen Antwortangaben, die die Person ja gemacht hat, die Werte einigermaßen valide zu schätzen, die die Person hätte machen müssen, wenn sie da angekreuzt hätte bei den Missing Values.
  • Aber das ist alles sozusagen nur die zweitbeste Alternative.
  • Die allerbeste Alternative ist, keine Missing Values zu haben.
  • Und da sollte unser Bestreben auch hingehen als Testdiagnostiker.
  • Wie man es statistisch dann nachher ausbügeln kann, ist sozusagen von zweiter Priorität, aber möglich.

Mit wie viel Prozent unbeantworteten Fragen kann man den Test dann wegschmeißen?

Die Frage geht danach, bei wie viel Prozent Missing Values muss man das Profil, also hier das Persönlichkeitsprofil eines Probanden, löschen?

  • Das definieren üblicherweise die Testautoren.
  • Das muss im Testmanual drinstehen.
  • Beispielsweise ab so und so viel Prozent der Items oder ab der und der Stückzahl ist von einer Auswertung Abstand zu nehmen.
  • Das ist beim Neopier auch gegeben.
  • Da ist es so, wenn eine Facette, beispielsweise die Facette N1 Ängstlichkeit besteht, wie alle Facetten im Neopier aus acht Items, wenn da nicht mindestens sechs Items ausgefüllt wurden, wird keine Diagnose für die Facette Ängstlichkeit mehr berechnet.
  • Aber das ist von Test zu Test verschieden.
  • Okay.
  • Das heißt, die Hauptfunktion der Instruktion, und da waren wir stehen geblieben, ist zunächst mal eine gewisse Werbung zu machen, nämlich Erwecken der Teilnahme, Motivation und Aufbau eines Vertrauensverhältnisses. Ganz wichtig, wie eben schon gesagt.
  • Zum Beispiel über Aussagen wie: 'Die Daten werden vertraulich behandelt.'
  • Bei seriöser Forschung geht man im Übrigen davon aus, dass sie das tun, aber es ist wichtig, dass sie es auch kommunizieren.
  • Es gibt keine richtigen und falschen Antworten.

Das gilt nur für welche Testklasse?

  • Das gilt natürlich nur für Persönlichkeitstests.
  • Im Intelligenzbereich gibt es natürlich sehr wohl richtige und falsche Antworten.
  • Also, bitte nicht anwenden.
  • Oder die Formulierung zum Beispiel: 'Sie werden auf den folgenden Seiten eine Reihe von Aussagen über bestimmte Verhaltensweisen, Einstellungen oder Ähnliches finden.'
  • Sie können entweder so oder so oder so oder so antworten.
  • Überlegen Sie bitte nicht erst, welche Antworten den besten Eindruck machen könnten.
  • Setzen Sie bitte immer ein Kreuz.
  • Setzen Sie bitte immer ein Kreuz, um Missing Values zu vermeiden.
  • Und warum steht da: Machen Sie es möglichst spontan, also möglichst zügig.
  • Das steht jetzt hier nicht direkt, aber bei vielen anderen Testverfahren.

Was ist die Idee dahinter?

Bitte?

  • Ja, vielleicht damit sie nicht lange überlegen, was sozial angemessen wäre.
  • Genau, was sozial erwünscht ist.

Wenn man darüber nachdenkt, dann denkt man hinterher, was ist die Messintention?

Was wollen sie eigentlich genau?

Was sieht am besten aus?

Was wollen sie von mir?

  • Das soll vermieden werden.
  • Meistens sind die intuitiven Antworten, die sie recht zügig machen, auch die validesten.
  • Gut, und die Belohnungsfrage ist natürlich, wenn Sie dem Forscher damit einen Gefallen tun, dass Sie jetzt Ihre wertvolle Zeit in die Beantwortung dieses Fragebogens investieren und sich ein wenig selbst offenbaren.

So what?

Möchte der Proband natürlich wissen, was er davon hat?

  • Und da gibt es unterschiedliche Möglichkeiten.
  • Die Sie klären sollten im Voraus.
  • Das ist mittlerweile bei wissenschaftlichen Publikationen auch Standard geworden, dass man angibt, was man den Probanden für ihre Teilnahme angeboten hat, als Kompensation.
  • Und das kann dann zum Beispiel Geld sein, Feedback, also zum Beispiel ein Persönlichkeitsprofil oder bei kleineren Studien. Das haben wir früher in der allgemeinen Psychologie gemacht, wo ich mal Hilfskraft war. Wenn das nur fünf Minuten dauert, gab es ein Duplo oder irgendwas Süßes, ein Überraschungsei oder so.
  • Es ist ziemlich wichtig, dass Sie das im Voraus klären.
  • Es gehört sozusagen zu dem Kontrakt, den Sie als Diagnostiker mit dem Probanden oder der Probandin abschließen.
  • Entschuldigung, ich habe einen Punkt vergessen.

Wie könnte so eine Instruktion aussehen?

  • Sie finden das immer vorne in den Bögen, die gerade kursieren.
  • Hinweise zum Ausfüllen des beiliegenden Antwortbogens.
  • Hier wird noch einmal der Antwortmodus erläutert, was die einzelnen Abstufungen, starke Ablehnung, Ablehnung neutral, Zustimmung, starke Zustimmung bedeuten.
  • Ich denke, das ist selbsterklärend, wenn Sie es vor sich haben.
  • Schauen Sie mal rein, wenn der Fragebogen bei Ihnen vorbeikommt.
  • Das dient der Einstimmung der Person auf die Testsituation.
  • So, jetzt kommen wir zu einem wichtigen Punkt, den ich eben in der Mindmap-Übersichtsgrafik auch schon gezeigt habe.
  • Befasst sich damit mit der sprachlichen Gestaltung der Items.
  • Darüber werden wir jetzt in dieser Sitzung und der folgenden Sitzung sowie beispielsweise auch in der Klausur noch sprechen.
  • Dahingehend, bitte stellen Sie sich wieder die Grundlogik der Testdiagnostik vor.
  • Wir geben Stimuli vor, das sind üblicherweise Items.
  • Das sind üblicherweise oder klassischerweise auch Items, die sprachlich gestaltet sind.
  • Personen reagieren darauf. Aus den Reaktionen schließen wir auf Merkmalsausprägungen zurück.
  • Das heißt, Items sind elementare Bestandteile, auf denen unsere Diagnostik fußt.
  • Das heißt, im Vergleich beispielsweise mit einem Kochrezept kann man sagen, wenn Sie gute Lebensmittel für Ihr Gericht verwenden, dann ist das schon mal eine gute Voraussetzung dafür, dass es nachher etwas taugt, das Essen.
  • Es reicht aber noch lange nicht.
  • Sie müssen es auch noch irgendwie gut zubereiten, die Zutaten.
  • Aber gute Zutaten sind erstmal eine gute Voraussetzung dafür, dass es nachher ein gutes Essen wird.
  • Und ganz ähnlich ist es bei Testdiagnostik und Items.
  • Items sind die kleinstmöglichen Bestandteile eines Tests.
  • Wenn sie schon einmal etwas taugen hinsichtlich ihrer sprachlichen Gestaltung und ihrer psychometrischen Qualität, über die wir im Laufe dieser Vorlesung noch sprechen werden, dann ist schon einmal eine solide Grundlage dafür geschaffen, dass die Reaktionen, die die Items provozieren, interpretierbar sind und ein valides Urteil über die Merkmalsausprägung der Probanden liefern.

Okay?

  • Das heißt, wir fangen sozusagen auf dem niedrigsten Level an, nämlich erstmal bei den Items.
  • Und da sie üblicherweise sprachlich gestaltet sind, schauen wir uns mal an, wie die gestaltet sein müssen, sprachlich damit, die was taugen.
  • Und das hört sich jetzt zunächst mal, Sie werden das sehen, alles sehr einfach an.
  • Es ist in der Praxis, aber dann deutlich schwerer, gute Items zu finden.
  • Also, jedes Item sollte so beschaffen sein, dass Personen mit unterschiedlichen Standpunkten gegenüber dem jeweiligen Einstellungsobjekt unterschiedlich auf das Item reagieren.
  • Das ist klar.
  • Beispielsweise lautet ein Extraversion-Item: 'Ich gehe gerne auf Partys.'
  • Wer gerne auf Partys geht, sollte dementsprechend starke Zustimmung ankreuzen.
  • Wer das nicht tut, zeigt also starke Ablehnung.
  • Das heißt, es sollte erstmal differenzieren.
  • Es sollte also interindividuelle Unterschiede in diesem Merkmal abbilden können.
  • Dies ist der Grundsatz, dem wir in der psychologischen Diagnostik folgen.
  • Jetzt kann es verschiedene Probleme geben.
  • Die Items können zu allgemein oder mehrdeutig formuliert sein, sodass der Proband das Item vage interpretieren muss.

Nach dem Motto, ja, was wollen die jetzt eigentlich genau von mir wissen?

  • Ein Beispiel bringe ich Ihnen gleich.
  • Also, Mehrdeutigkeit soll man vermeiden bei Items.
  • Also, sie sollen glasklar verständlich formuliert sein.
  • Vermeiden sollte man nach Möglichkeit auch Generalisierungen.
  • Die Item-Formulierung sollte möglichst an konkretem Verhalten orientiert sein.
  • Mögliches Problem ist unklarer Antwortbezug, ich bringe gleich ein Beispiel dazu.
  • Potenzielles Problem sind Fremdwörter.
  • Nicht alle Personen sind so gebildet wie Sie und kennen sich in unterschiedlichen Sprachen gut aus und das damit einhergehende Vokabular.
  • Wenn ich als Proband diesen Fragebogen ausfülle, sind Fremdwörter enthalten. Normalerweise schlage ich dann nicht extra nach, was damit gemeint ist.
  • Das bedeutet, dass die Items, die Sie für die Normalbevölkerung formulieren - und das ist die übliche Zielgruppe, beispielsweise bei Persönlichkeitstests -, allgemein verständlich sein müssen, also fremdwortfrei.

Ein Problem sind zum Beispiel mehrere Gedanken in einem Satz.

  • Ein Beispiel hierfür ist die Aussage: 'Ich gehe regelmäßig in die Kirche, teile aber nicht die offizielle Auffassung der katholischen Kirche zum Thema Sexualität'.
  • So, Antwortmodus.
  • Im einfachsten Fall: Ja, Nein.
  • Die Person kreuzt Ja an.

Wie interpretieren Sie die Antwort Ja?

Heißt das dann, ich gehe regelmäßig in die Kirche?

Oder?

  • Ich teile die offizielle Auffassung der katholischen Kirche zum Thema Sexualität nicht, oder beides.
  • Wenn jemand Nein ankreuzt, gilt das nur für den ersten Satzteil, für den zweiten Satzteil oder für beides.
  • Diese interpretativen Mehrdeutigkeiten will man eliminieren in der seriösen psychologischen Diagnostik.
  • Deshalb würde man präventiv hier zwei Items daraus machen.
  • Ich gehe regelmäßig in die Kirche.
  • Kann man beantworten mit ja, nein, beispielsweise oder als zweites den zweiten Teil des Satzes in ein einzelnes Item kleiden, und schon ist der Antwortbezug wieder klar.
  • Dieses Item war ein Beispiel dafür, dass der Antwortbezug unklar war.
  • Für Fremdwörter war es jetzt kein gutes Beispiel, das stimmt natürlich.
  • Also, unklarer Antwortbezug ist ein sehr häufiges Problem, das man vermeiden sollte.
  • Ein weiteres Problem sind Negationen, Mehrfachverneinungen oder extreme Formulierungen.
  • Das Problem bei extremen Formulierungen ist, dass sie häufig keine Varianz in den Antworten finden.
  • Und das kann nicht der Zweck von Diagnostik sein.
  • Also, das heißt, man kann zusammenfassen, dass die Items sinnvoll sein müssen, gewisse ethische Grundprinzipien beachten und auch wohl formuliert sein sollten.
  • Und das ist wirklich leichter gesagt als getan.
  • Sie werden das spätestens dann merken, wenn Sie ein Konstrukt messen wollen, z.B.
  • im Rahmen einer Diplom-Arbeitserstellung und Sie überlegen sich eine Testskala zu dem Konstrukt Ihrer Wahl und müssen sich Items überlegen, dann werden Sie feststellen, Items zu kritisieren ist ganz schön einfach, aber sich gute Items zu überlegen ist ganz schön schwierig.
  • Das heißt, wir können noch einmal ein paar weitere Punkte, die diese sprachliche Gestaltung der Items ausmacht, durchgehen.
  • Vielleicht, nachdem Sie Ihre Frage gestellt haben.
  • Also, ich wollte fragen, wenn Sie zum Beispiel einen Test haben, der schlecht übersetzt ist, also das kann ja auch manchmal vorkommen, ob man dann selbst eine Frage umformulieren kann.
  • Ja, okay.
  • Also, die Frage zielt darauf ab.
  • Es gibt einen bestehenden Test, der üblicherweise aus dem angelsächsischen Sprachraum ins Deutsche übertragen wurde und Sie sind nicht zufrieden mit der Übersetzung.

Was kann man tun?

  • Üblicherweise ist das jetzt ein Problem bei Testverfahren. Sie können jetzt den Item-Wortlaut abändern.
  • Wenn Sie möchten, machen Sie quasi eine eigene Übersetzung oder eine Item-Neuentwicklung.
  • Die Normierungsdaten, die Sie in der deutschen Übersetzung finden, beziehen sich aber auf den Wortlaut, mit dem Sie nicht zufrieden waren.
  • Das heißt, Sie können die Umformulierung, also Ihre alternative Übersetzung, nicht direkt mit den Normierungsdaten, die für die deutsche Übersetzung herangezogen werden, vergleichen.
  • Das ist das Problem.
  • Weil die Testverfahren nachher normiert werden.
  • Was genau das ist, lernen Sie erst am Ende der Veranstaltung.
  • Aber man muss empirisch überprüfen, wie zum Beispiel die Leute auf die einzelnen Items ankreuzen, wie die Verteilungen sind und so weiter.
  • Und das bezieht sich dann natürlich auf den Item-Wortlaut, den die Übersetzer gewählt haben und nicht auf ihren Wortlaut.
  • Das ist das Problem.

Wie kommt es denn, dass man bei verschiedenen Tests für ein Item immer eine verschiedene Anzahl an Fragen stellt?

Für ein Item verschiedene Anzahl an Fragen?

  • Ich würde es gerne korrigieren. Ihre Aussage und sagen, für ein Konstrukt eine verschiedene Anzahl an Fragen stellt.
  • Ja, ein Item ist ja eine Frage.
  • Und es kommt darauf an. Üblicherweise sagt man, je breiter ein Konstrukt ist, desto mehr Fragen brauche ich, um es einigermaßen umfänglich zu erfassen.

Aber ich muss doch dann letztendlich bei der Auswertung die Werte schon normieren, oder?

  • Damit ich sie überhaupt auswerten kann.
  • Nein, normalerweise normiert man bei einer Testentwicklung ganz zum Schluss erst.
  • Was Sie meinen, ist die Testauswertung, und Sie addieren dann die einzelnen Kreuzchen, die die Leute gemacht haben.
  • Das ist etwas anderes als normieren.
  • Ich meine, wir sind beim Umfragebogen.

Welchen Fragebogen?

  • Unsicherheitsfragebogen.
  • Unsicherheitsfragebogen.
  • Sagt mir nichts, aber Fernsehen Sie ruhig fort, ich kann mich eindenken.
  • Das hat damit zu tun, dass manche Konstrukte leichter messbar sind.
  • Das heißt, man braucht dann weniger Items als bei komplexeren Konstrukten.

als komplexere Konstrukte.

  • Also, Ängstlichkeit ist üblicherweise ein Konstrukt, das man in der Psychologie verwendet, um es einigermaßen reliabel zu erfassen. Das weiß ich, weil es in vielen Persönlichkeitstests vorkommt, dass man es mit ungefähr acht bis elf Items messen muss, damit die Reliabilität hoch genug ist, um es akzeptieren zu können.
  • Wohingegen das Nicht-Nein-Sagen-Können auch ein wichtiges Konstrukt ist, beispielsweise bei der Messung sozialer Kompetenz.
  • Das Nicht-Nein-Sagen-Können ist sicherlich ein einfacheres Konstrukt, da ich weniger Items benötige, um die Reliabilität zu messen.
  • Daher kommt es, dass man unterschiedliche Konstrukte mit unterschiedlichen Item-Anzahlen zuverlässig messen kann.
  • Und das ist ein wichtiger Grundsatz, über den Sie in dieser Vorlesung noch aufgeklärt werden.
  • Wir wollen natürlich maximale Information mit der minimalsten möglichen Anzahl von Items haben.
  • Also den Test nur so lange machen, wie er wirklich sein muss, damit er etwas taugt.
  • Gut, also müssen wir bei der sprachlichen Gestaltung von Items darauf achten, dass wir mehrdeutige Begriffe vermeiden.
  • Oder Begriffe vermeiden, die nur einem Teil der Probanden geläufig sind.
  • Das betrifft zum Beispiel Fremdwörter.

Wenn der Proband das Item nicht verstanden hat, wie soll dann seine Reaktion für uns als Testauswerter interpretierbar sein?

  • Das ist wertlos.
  • Deshalb müssen wir unbedingt auf Verständlichkeit achten.
  • Jede Aufgabe soll nur einen Aspekt oder Gedanken enthalten.
  • Das heißt, keine durch UND verbundenen Aussagen, wie beispielsweise das katholische Kirchenbeispiel eben.
  • Das wäre unklarer Antwortbezug.
  • Möglichst positive Aussagen, Fragen oder Formulierungen formulieren, um zu vermeiden, dass man doppelte Verneinungen drin hat.
  • Dann sollen Verallgemeinerungen jeder Art vermieden werden, besonders solche, die nur zeitweise Gültigkeit haben.
  • Also, wenn Sie jetzt irgendwie Bezug nehmen auf Sachen, die jetzt vielleicht nur ein Jahr oder so in der öffentlichen Meinung vertreten sind.
  • Wenn Sie zum Beispiel messen wollen, bei Jugendlichen das Fernsehverhalten und Sie machen da ein Item rein zu den jetzigen Kandidaten von 'Deutschland sucht den Superstar'.
  • Wenn Sie den Test in zwei Jahren vorgeben, kennt die Leute keinen Menschen mehr.
  • Das heißt, da sollten Sie vermeiden, dass Sie da die Namen von diesen Kandidaten aus dem Jahr 2007 einbeziehen.
  • Wenn der auch in Zukunft noch angewendet werden soll.
  • Das wäre also ein Beispiel für zeitweise Gültigkeit.
  • Oder auch noch ein guter Tipp ist, vermeide umständliche Länge oder telegrafische Kürze im Aufgabentext, sowie prüfe die Eindeutigkeit der Frage an einer kleinen Teilstichprobe.
  • Das sollten Sie, wenn Sie einen Test Neuentwicklung machen, generell tun.
  • Sie haben eine gewisse Auffassung davon, was diese Items messen sollen, und Sie sind, nachdem Sie sich selbst daran gesetzt haben, wirklich der Überzeugung, dass das verständlich ist und die Items eindeutig sind.
  • Um das Ganze aber wirklich zu objektivieren, Ihren Eindruck, ist es wichtig, dass Sie zunächst mal, bevor Sie die große Stichprobe befragen, eine kleine Teilstichprobe, beispielsweise fünf Freunde befragen, ob dieser Item-Wortlaut auch für Sie als völlig unbedachte Person genauso eindeutig ist, wie Sie es sich erhofft haben.
  • Das ist so eine Art Prä-Test.

Gut, jetzt schauen wir uns ein paar Antwortmodi an.

  • Haben wir heute schon darüber gesprochen, ganz einfach.
  • Dichotomer Antwortmodus, ja, nein, stimmt, stimmt nicht.
  • Hat immer gewisse Vor- und Nachteile.
  • Die Antwortmodi haben immer gewisse Vor- und Nachteile, die ich jetzt mit Ihnen im Folgenden besprechen möchte.
  • Dichotome Antworten haben wie alles andere Vor- und Nachteile.
  • Der Vorteil ist, dass der Proband sich entscheiden muss.
  • Es geht nur um Ja oder Nein.
  • Vielleicht gibt es das nicht mehr wie früher bei den Zettelchen in der Schule.
  • Zuverlässigere Ergebnisse gibt es im Vergleich zu anderen Verfahren, jedoch auf Kosten der Validität.
  • Warum das so ist, möchte ich zum jetzigen Zeitpunkt noch nicht erklären, sondern darauf komme ich zurück, wenn wir in einigen Wochen darüber sprechen werden.
  • Nehmen Sie es im Moment bitte noch so zur Kenntnis.
  • Der Nachteil ist, dass durch die fehlende mittlere Antwortmöglichkeit die Antwort nicht der tatsächlichen Einstellung des Probanden entsprechen muss, und es besteht die Gefahr der Suggestivwirkung und der Ja-Sage-Tendenz.

Was ist diese Ja-Sage-Tendenz?

Haben Sie damit schon einmal im Laufe Ihres Studiums zu tun gehabt?

Kennen Sie das Fachwort dafür?

Nee?

  • Das Fachwort für Ja-Sage-Tendenz ist Aquieszenz.

Was glauben Sie, was es damit auf sich hat?

Und warum ist das potenziell für uns als Testdiagnostiker ein Problem?

  • Sie sehen so aus, als wüssten Sie es.
  • Es verfälscht das Testergebnis.
  • Ja, klar, es verfälscht das Testergebnis.

Und warum glauben Sie, dass die Ja-Sage-Tendenz ein Phänomen ist, das es gibt?

Woher kommt das vermutlich?

  • Weil der soziale Wunsch da ist, Ja zu sagen anstatt Nein.
  • Exakt.
  • Aber dem kann man ja entgegenwirken, indem man die Antwort einfach umgibt.
  • Genau, das kann man auch machen.
  • Das ist sozusagen, wie man das Problem behebt.
  • Üblicherweise sind wir so sozialisiert, schon von Kindesbeinen an, dass die Mama oder der Papa lieber Ja hört als Nein.
  • Also, wir sind schon von Kindesbeinen an daran gewöhnt, dass das Ja-Sagen das ist, was üblicherweise eher von einem selbst erwartet wird.
  • Und diese Tendenz kann sich jetzt auch hier bei der Fragebogenausfüllung niederschlagen.
  • Das ist für uns aber ein Problem, wenn die Leute abstrahierend von den Inhalten, die erfragt werden, tendenziell eher mit Ja antworten als mit Nein, dann verzerrt das die Testdiagnose.

Das heißt, was kann man machen?

  • Ihre Kommilitonin hat es richtig gesagt.
  • Ich kann manche Items umpolen.
  • Also, negativ formulieren, aber bitte keine doppelten Verneinungen verwenden.
  • Und dann wäre die negative Antwort diejenige, die für ein positives Merkmal spricht.
  • Das wäre einfach umgekehrt.
  • Ein Beispiel: Ich gehe gerne auf Partys.
  • Ja, nein, klar.
  • Wenn man es umformuliert, bedeutet es, dass ich ungerne oder gar nicht gerne auf Partys gehe.
  • As simple as that.

Wann sind dichotome Fragen geeignet?

  • Wenn ein Test schnell erstellt oder improvisiert werden muss.
  • Wenn die Testdurchführung wenig Zeit beanspruchen soll.
  • Ein wichtiger Punkt, genau.
  • Wenn die Auswertung durch Hilfspersonal geschieht.
  • Wenn der Aufgabeninhalt leicht verständlich ist.
  • Oder wenn Informationen über ein Persönlichkeitsmerkmal auf möglichst breiter Basis durch möglichst viele Fragen und Aufgaben erzielt werden sollen.
  • Wenn die gedankliche Verarbeitung und Gedächtnisleistung keine Rolle spielen und wenn Zufallslösungen irrelevant sind oder berücksichtigt werden, durch eine Zufallskorrektur.
  • Gerade im Fall der dichotomen Items ist natürlich der Zufall eine wichtige Größe, aber es gibt statistische Möglichkeiten, das zu kontrollieren.

Was glauben Sie eigentlich, welche Probandengruppe bevorzugt denn dichotome Antwortmodi?

Kinder vielleicht? Ja, das könnte sein.

Okay, und im Erwachsenenbereich?

  • Darauf wollte ich eigentlich hinaus, dazu gibt es auch Studien.

Glauben Sie, dass eher intelligentere oder eher weniger intelligente Personen dichotome Antwortmodi bevorzugen?

Intelligentere bevorzugen Dichotomie?

  • Nein, das Gegenteil ist der Fall.
  • Je komplexer kognitiv, desto stärker die Vorliebe, üblicherweise für mehrfach abgestufte Antwortalternativen.
  • Aber zum Beispiel sind dichotome Antwortmodi gut bei Symptomchecklisten.
  • Wenn Sie später Therapeut werden wollen und Sie eine klinische Diagnose stellen müssen, dann gibt es vorbereitete Unterlagen, die es Ihnen ermöglichen festzustellen, sind diese Symptome vorhanden, ja, nein, ja, nein und so weiter.
  • Und so können Sie dann mit dieser einfachen dichotomen Antwortart herausfinden, ob mit einer gewissen Wahrscheinlichkeit ein gewisses Störungsbild vorhanden ist.
  • Im Persönlichkeitstestbereich ist es mittlerweile out of fashion, Dichotom zu antworten.
  • Die wenigsten Verfahren machen das noch so.
  • Die meisten bieten ein anderes Verfahren an, wie auch der NeopDR.
  • Kommen wir gleich noch darauf.
  • Hier sind wir schon.
  • Das sind nämlich die Schätzskalen oder Ratings.
  • Zum Beispiel von 0.
  • 0 ist gelabelt mit Lehne ab bis zu 4 Stimme zu.
  • Und irgendwo auf diesem Spektrum mögen Sie sich bitte einordnen.
  • Das ist heutzutage die gängige Art von Antwortmodi im Persönlichkeitsbereich.
  • Der Vorteil dabei ist, dass die Personen besser die tatsächlichen Einstellungen des Probanden wiedergeben können, weil man graduell angeben kann.
  • Der Nachteil ist, dass bei einer ungeraden Anzahl von Antwortmöglichkeiten, wie zum Beispiel bei fünf Alternativen, die mittlere Kategorie oft nicht eindeutig interpretierbar ist.
  • Es bleiben auch noch weitere Interpretationsmöglichkeiten für diese Mittelkategorie offen.
  • Und das möchten wir eigentlich vermeiden.
  • Wir möchten ein klar verständliches Item haben und eine klare Interpretation der Reaktionen der Probanden auf dieses Item erhalten.
  • In der Regel.
  • Das ist unser Ziel.
  • Wenn es jetzt diese Mittelkategorie gibt, wie bei ungeraden Ratingskalen, dann kann man die Mittelkategorie auch alternativ interpretieren.
  • Zum Beispiel, indem man sagt, derjenige wusste nicht so richtig, was er sagen sollte, er hat sich jetzt mal so in die Mitte geflüchtet.
  • So nach dem Motto, manche Probanden machen das übrigens auch, wenn ich ihn in der Mitte ankreuze, dann wird es schon passen.
  • Mal schön unauffällig mit der Masse schwimmen.
  • Das führt auf jeden Fall zu keinem negativen Ergebnis.
  • Die goldene Mitte ist auch im Persönlichkeitsbereich immer das Richtige.
  • Sachlich ist das in vielen Fällen auch richtig, aber das ist für die Diagnostik unvorteilhaft, weil diese Art von Antwortstil uns als Diagnostiker einfach ein Dorn im Auge sein muss.
  • Deshalb ist die Frage, wie können wir dagegen vorgehen, dass es so etwas gibt.
  • Das heißt, der Proband kann sich auch nicht kompetent fühlen für die Beantwortung dieser Frage, zum Beispiel, weil da Fremdwörter drin waren.
  • Und er fühlt sich jetzt irgendwie ungebildet, weil er nicht weiß, was das Fremdwort bedeutet.
  • Also sagt er mal, na gut, dann nehmen wir die Mittelkategorie, fällt nicht weiter auf.
  • Oder es gibt eine Gleichgültigkeit, Faulheit oder Motivationsprobleme des Probanden.
  • Und dann finden Sie, wenn Sie groß angelegte Forschung im Persönlichkeitsbereich machen, ich komme gleich auf Sie zu sprechen, und Sie finden dann Profile, die die Leute in fünf Minuten mal gerade ausgefüllt haben, immer die Mittelkategorie, immer Mitte angekreuzt, seitenweise. Das Profil können Sie von der Auswertung getrost ausschließen, das wird auf keinen Fall valide sein.
  • So etwas kommt häufiger vor, wenn Sie solche Studien durchführen, also müssen Sie darauf vorbereitet sein.

Außerdem werden diese Rating-Skalen als Intervall-Skalen behandelt.

  • Das ist ein Skalenniveau, das Sie kennen, Intervall-Skalen.
  • Es ist jedoch umstritten, ob man das darf.
  • Üblicherweise geht man davon aus, dass mit diesen Rating-Skalen aber Intervall-Skalen vorliegen.

Das heißt, was kann man machen?

  • Die meisten Methodiker sind sich mittlerweile einig darüber, dass man besser, und hier steht es, Schätzskalen, das heißt Ratingskalen mit gerader Anzahl von Ratingmöglichkeiten anbietet, also beispielsweise sechsstufig.
  • Bei einer sechsstufigen Antwortskala gibt es keine direkte Mittelkategorie, sondern ich muss zumindest tendenziell sagen, eher in die eine Richtung oder eher in die andere Richtung.
  • Das ist im Moment die Mehrheit der Personen, die das so sieht.
  • Aber Sie sehen zum Beispiel im Neo PIR und vielen anderen Testverfahren ist es auch ein ungerader Antwortmodus, nämlich üblicherweise fünf Stufen.
  • Und die Verfahren funktionieren trotzdem.
  • Wenn Sie aber etwas Neues entwickeln, empfehle ich Ihnen vielleicht den gradzahligen Abstufungsmodus.
  • So, dann gibt es natürlich noch unterschiedliche weitere Möglichkeiten, Antwortmodi zu gestalten.
  • Beispielsweise grafische Angaben mit Smileys.
  • Wird häufig in der Markt- und Werbepsychologie verwendet.
  • Nennt man auch Kunin-Skala nach dem Erfinder Herr Kunin.
  • Das ist intuitiv auch klar.
  • Also diese Smileys werden üblicherweise verwendet bei Zufriedenheitsstudien mit Produkten oder Dienstleistungen.
  • Da ist es auch selbsterklärend, was es bedeutet.
  • Oder hier Multiple-Choice-Fragen.
  • Kennen Sie wahrscheinlich aus leidlicher Erfahrung aus Ihrem Studium.

Oder solche Art gestaltete Antwortalternativen.

  • Ich komme gerne in dieses Seminar, diese Vorlesung immer, oft, manchmal, selten, nie.
  • Die Vorteile bei diesen Vorgehensweisen sind, es ist eine ökonomische Durchführung und Auswertung möglich.
  • Es gibt eine geringe Ratewahrscheinlichkeit, wenn die Distraktoren gut sind.
  • Distraktoren sind, da spricht man insbesondere bei Multiple-Choice-Items von, sind die Antwortalternativen, die falsch sind.
  • Also nehmen wir mal hier, Deutschland war Fußballweltmeister.
  • 68, 80, 74, 84.

Was ist die richtige Antwort?

  • Jetzt höre ich so ein Stocken, manche scheinen sich nicht so richtig sicher zu sein.

74?

  • Nochmal kurz das Lied im Hinterkopf laufen lassen.
  • Okay, das heißt alle anderen Alternativen als die richtige sind natürlich Distraktoren.
  • Und Sie können sich vorstellen, als Klausurkonstrukteur hängt die Schwierigkeit der Klausur insbesondere davon ab, wie gut es Ihnen gelingt, Fallen zu stellen mit den Distraktoren.
  • Man sollte das nicht tun, aber manchmal wird es ja gemacht.
  • Distraktoren sind also die Antwortalternativen, bei denen Sie auf den Leim gehen, umgangssprachlich formuliert.
  • Und die Erfahrung in der Formulierung von Items ist dringend notwendig, insbesondere bei Multiple-Choice-Fragen.
  • Sie werden da ein Lied davon singen können.
  • Wenn das nicht gut gemacht ist, ist es extrem schwierig, ihre Leistungsfähigkeit beispielsweise im statistischen Bereich zu diagnostizieren.
  • Da kann man sehr spitzfindige Item-Formulierungen bei den Distraktoren finden, und ratzfatz haben die Leute es angekreuzt, obwohl es falsch war.
  • Also, es ist wirklich schwierig, gute Multiple-Choice-Klausuren zu konstruieren, aber trotzdem ist es möglich, mit einiger Erfahrung.
  • Offene Antwortmöglichkeiten haben wir bereits im Rahmen des qualitativen Vorgehens erwähnt.
  • Es ist klar, dass dies Vorteile bei der Erfassung bestimmter Eigenschaften wie Ausdrucksfähigkeit, Wortschatz und so weiter hat.
  • Ein Problem hierbei ist die Schwierigkeit, Objektivität bei der Auswertung zu erreichen, wie es im qualitativen Bereich häufig der Fall ist, und die Auswertung ist zeitaufwendig.
  • Ich kann natürlich nicht mit Schablonen arbeiten.
  • Hier kann ich nur schwer ohne Computerunterstützung arbeiten.
  • Mit diesen Problemen muss ich leben, wenn ich auf diese Weise vorgehe.
  • Oder Testaufgabenbeispiele, die Sie hier sehen, entstammen Intelligenztests.
  • Meines Wissens nach ist das aus dem IST 2000 R, also Intelligenzstrukturtest 2000.

Hier, wie Blitz zu hören verhält sich wie Donner zu, was bitte?

  • Bitte ergänzen Sie das aus einer vorgegebenen Anzahl von Alternativen.
  • Oder sortieren Sie die folgenden Brüche der Größe nach, beginnen Sie mit dem größten und finden Sie dann diese Bruchreihe hier vorgegeben.
  • Und das Schöne an diesen Aufgaben ist, sie sind ja Leistungstestaufgaben. Das heißt, es gibt eine definitiv richtige Lösung, für deren Auffinden Sie einen Punktwert bekommen und für deren Nicht-Auffinden eben keinen.
  • Das ist halt ein gutes Beispiel für die Differenzierung von Persönlichkeitstests.
  • Oder Lückentexte.
  • Hier finden Sie, klassisch ist selbsterklärend. Lückentexte haben die Vorteile, sie sind frei von Zufallseinflüssen.
  • Die Antwortformulierung erfolgt nach freiem Ermessen.
  • Ups, das ist ja doppelt.
  • Es ist recht zeitaufwendig und nicht immer eindeutig hinsichtlich der Objektivität.
  • Also, ich denke, darüber brauchen wir keine weiteren Worte verlieren.
  • Genauso wenig über die Zuordnungsaufgaben, die selbsterklärend sind.
  • Diese Zuordnungsaufgaben eignen sich zur Feststellung des erworbenen Wissens.
  • Also zum Beispiel werden diese Aufgaben häufig gemacht, um beispielsweise Deutsch als Fremdsprache zu testen.
  • Ob ausländische Personen, also Nicht-Deutsch-Muttersprachler, gewisse Formulierungen schon in ihrem Wortschatz erworben haben.
  • Daraus ist das auch genommen.
  • Es gibt eine große Anzahl von Aufgaben auf kleiner Fläche.
  • Das ist also, wenn Sie so wollen, hinsichtlich des Vorgaberaums ökonomisch.
  • Und die Lösungsfindung erfolgt nicht selbstständig, da die Antworten vorgegeben sind.
  • Eine völlig freie Nennung wäre schwieriger.

Weitere Möglichkeiten, wie Testaufgabenbeispiele gegeben sein können, sehen Sie hier.

An welchen Flüssen liegen die folgenden Städte?

  • Es ist also halb offen.
  • Und hier schauen wir uns mal Beispiele an, die ein bisschen komplexer sind. Wie man versucht hat, das sind Beispiele von Studierenden, wie man versucht hat, gewisse Konstrukte zu erfassen.
  • Also beispielsweise hat sich jemand interessiert für den Zusammenhang des Konstrukts Neurotizismus. Also Ängstlichkeit wird häufig auch bezeichnet oder emotionale Instabilität mit dem Konstrukt Abhängigkeit der Stimmung vom Wetter.

Was glauben Sie, was war die Hypothese?

Bei gutem Wetter ist die Stimmung besser und das gilt insbesondere für welche Personen, was die Neurotizismus-Ausprägung angeht?

  • Leute, die neurotischer sind, sind stimmungsabhängiger, was das Wetter angeht.
  • Das war die Hypothese, die dahinter lag.
  • Das kam tendenziell raus, wenn auch nicht so wahnsinnig stark, aber tendenziell zumindest.
  • Das heißt, diese Person, die diese Diplomarbeit gemacht hat, musste sich jetzt Items überlegen.

Wie kann ich die Abhängigkeit der Stimmung vom Wetter mit einem Fragebogen erfassen?

Was könnten also Items sein?

  • Und das waren die Lösungen, die gefunden wurden.
  • Sonne hält meine Stimmung auf.
  • Oder bei miesem Wetter werde ich schneller ungeduldig als sonst.
  • Man hätte auch sagen können, schneller übellaunig, hätte man auch nehmen können.
  • Oder trübes Wetter hat keinen Einfluss auf meine Stimmung.
  • Oder bei gutem Wetter fällt es mir leichter, freundlich zu anderen zu sein.
  • Ja, das ist eine Auswahl von Items, die die Person jetzt ausgewählt hat.
  • Selbst überlegt und dann nach Studie zugeführt und dann nachher die Ergebnisse mit Neurotizismus korreliert.
  • Oder an solchen Tagen lache ich häufiger, das ist auch noch ein weiteres Item.
  • Oder zum Beispiel ein anderes Konstrukt.
  • Sie als potenzielle zukünftige Therapeutin könnten sich dafür interessieren, welche Einstellung Personen zur Psychotherapie haben.
  • Das ist für Sie wichtig, weil die Leute danach zu Ihnen in die Praxis kommen und eine bestimmte Einstellung zu Therapeuten, Psychologen und Psychotherapie mitbringen, die dem Gelingen des Therapieprozesses vielleicht nicht so zuträglich ist.
  • Das heißt, es ist gut zu wissen, was man über die Therapie als solche denkt.

Wie bewertet der oder diejenige überhaupt, dass er jetzt als beispielsweise Hilfesuchender vorstellig wird?

  • Das heißt, das kann man erfassen und nachher auch korrelieren mit beispielsweise, wenn Sie wollen, mit Bildung oder mit Intelligenz oder mit Neurotizismus.
  • Das ist auch gelaufen und die Items, die hier gefunden wurden, sind folgende.
  • Psychotherapie sollte denselben Stellenwert haben wie medizinische Behandlung.

Das zielt eben auf den Aspekt ab, wie ist das jetzt einzuschätzen im Gesundheitswesen?

Welchen Rang hat es da?

  • Das ist eine Möglichkeit.
  • Oder Therapeuten haben selbst psychische Probleme.

Das ist ja ein gängiges Vorurteil, wissen Sie?

  • Kommt ja häufig in den Krimis vor, dass die Psychologinnen, dummerweise, besonders schlecht dargestellt werden, so als wären sie selbst, sagen wir mal, etwas problematisch in ihrem Erleben und Verhalten.
  • Ein wichtiger Punkt, der mit der Einstellung zur Psychotherapie zu tun hat, könnte sein, dass wer sich in Therapie begibt, unfähig ist, seine Probleme selbst zu lösen.
  • Ich kann mir nicht vorstellen, jemals eine Psychotherapie zu brauchen.
  • Ja, das sind Punkte, über die die Person nachgedacht hat.
  • Natürlich gibt es noch einige weitere, insgesamt waren es glaube ich 15.
  • Und mit dem Verbund von Items kann man dann schon einiges erreichen, wahrscheinlich kann man die Einstellung zur Psychotherapie sehr gut messen.
  • Okay, weitere Möglichkeiten hinsichtlich anderer Konstrukte.
  • Zum Beispiel ist meine Arbeit meist eintönig und langweilt mich fast immer.
  • Das ist ein Item zur Erfassung der Arbeitszufriedenheit.
  • Das ist ein großes Thema in der Arbeits- und Organisationspsychologie: Arbeitszufriedenheit.

Wie wird diese nun erfasst?

  • Beispielsweise mit diesem Item.
  • Und Sie sehen, hier ist auch ein gradzahliger Antwortmodus. Es gibt jetzt keine direkte Mittelkategorie.
  • Oder Sie sagen, meine Arbeit ist eintönig und langweilt mich.
  • Oder Sie sagen, Neues Konstrukt.
  • Wenn ich zum Zahnarzt muss, habe ich jedes Mal extreme Angst.

Was ist das Problem, wenn Sie das Item so formulieren, wie das Letztgenannte?

  • Bitte.
  • Weil der Begriff extrem sehr relativ ist.
  • Den kann jeder für sich selber löschen.
  • Ja, also Ihre Kommilitonin weist darauf hin, dass der Begriff extrem sehr relativ ist.

Und was vielleicht noch?

  • Bitte.
  • Man nennt es Streuen durch diese extremen Ängste.
  • Das ist ein psychometrisches Problem noch.
  • Durch das Extrem.
  • Und jedes Mal extreme Angst.
  • Das Item ist jetzt so extrem formuliert, dass manche Leute, die das lesen und die zum Beispiel beim Zahnarzt befragt werden im Wartezimmer und die gleich drankommen, dass die dann denken, so, meine Herren, extreme Angst, das ist ja schon so etwas wie Todesangst oder so.
  • Und die erlebe ich jetzt nun wirklich nicht.
  • Da sage ich mal, wenn das ein Ja-Nein-Antwortmodus wäre, sage ich dann natürlich Nein.
  • Oder wenn das hier dieser sechsstufige Antwortmodus ist, dann sage ich, okay, nee, also das trifft jetzt wirklich nicht zu oder überhaupt nicht zu, weil jedes Mal extreme Angst.
  • Also auch bei so einem Kontrolltermin eher nicht.
  • Da müsste ich schon vorher da sein.
  • Das sind die meisten ja nicht, glücklicherweise.
  • Also durch so extreme Formulierungen, die wir vorhin angesprochen haben, provozieren Sie Reaktionen hier im Antwortmodus, die ungefähr bei 1 und 2 liegen oder bei 1, 2, 3.
  • Wahrscheinlich wird fast niemand 4, 5, 6 ankreuzen.
  • Das liegt an der Formulierung des Items.
  • Die Formulierung hingegen so wählt, ich habe Angst, wenn ich zum Zahnarzt muss, dann ist die schon weniger extrem und vermutlich werden dann auch mehrere Personen hier in diesem Bereich ankreuzen und nicht nur in diesem extrem nicht zutreffenden Bereich.
  • Sie kennen die Gütekriterien und die finden Sie hier auf dieser Folie.
  • Das sind Objektivität, Reliabilität und Validität.
  • Und wir können jetzt schon anfangen. Wir reden ja gerade über die sprachliche Gestaltung von Items als die kleinsten Bestandteile von Tests. Diese Gütekriterien schon anzuwenden auf die Zutaten, die kleinstmöglichen Zutaten in unserem Testverfahren, nämlich auf die Items.
  • Das heißt, die Items selbst müssen schon diesen Gütekriterien genügen.
  • Und das heißt Folgendes.
  • Das Item muss von verschiedenen Auswertern gleichermaßen als richtig oder falsch bewertet werden.
  • Das gilt für Leistungstests.
  • Klar, da gibt es ja diesen objektiven Gütemaßstab.
  • Die Reliabilität bedeutet auf Item-Ebene, dass gleiche Antworten bei kurzzeitiger Testwiederholung erwartet werden können.
  • Das heißt, natürlich nur dann, wenn Sie jetzt keine Stimmungen messen.
  • Wenn Sie Stimmungen messen wollen, die stark flüchtig über die Zeit hinweg sind, und ich sie jetzt messe und in zwei Stunden noch einmal, dann kann sich im Stimmungsbereich schon einiges geändert haben.
  • Wenn ich hingegen jetzt Persönlichkeit messe, also situationsstabile Merkmale, dann sollte es so sein, dass ich Sie, wenn ich Sie jetzt bitte, einen Fragebogen auszufüllen, beispielsweise den Neopir und in zwei Stunden, dass dann wirklich ziemlich ähnliche Diagnosen rauskommen sollen.
  • Das spricht dann für die Stabilität, also für die Reliabilität des Verfahrens.
  • Stabilität der Messung ist eine Facette, wenn Sie so wollen, von Reliabilität.
  • Im weiteren Verlauf der Vorlesung mehr dazu.
  • Und natürlich Validität.
  • Muss gewährleistet sein.
  • Eine Aufgabe ist nämlich dann valide, wenn sie von Probanden mit starker Merkmalsausprägung häufiger richtig beantwortet wird als von Probanden mit niedriger Merkmalsausprägung.
  • Das hat zu tun mit der Trennschärfe.
  • Und die Trennschärfe ist ein Thema, über das ich gerne beim nächsten Mal mit Ihnen sprechen möchte.
  • Zum heutigen, zum jetzigen Zeitpunkt möchte ich die heutige Sitzung mit Ihnen beenden.
  • Ich wünsche Ihnen eine schöne Woche.
  • Bis nächsten Montag.