GESIS Training Courses
user_jsdisabled
Suche

Wiss. Koordination

Dr. Nora Müller
Tel: +49 621 1246277

Administrative Koordination

Claudia O'Donovan-Bellante
Tel: +49 621 1246221

Multiple Imputation von fehlenden Werten: Theorie und Anwendung

Dozent(en):
Dr. Jörg Drechsler

Datum: 08.03 - 09.03.2018 ics-Datei

Veranstaltungsort: B2, 8 Mannheim

Seminarinhalt

Fehlende Werte stellen bei Umfragen grundsätzlich ein Problem dar. Wird für den Antwortausfall in der Datenanalyse keine Rechnung getragen, kann dies zu verzerrten Ergebnissen führen. Ein oft genutztes Verfahren zum Umgang mit partiellem Antwortausfall (item non-response) ist die multiple Imputation. Dieses Verfahren ermöglicht die Anwendung von statistischen Standardanalyseverfahren nach der Imputation. Jedoch führen Missverständnisse hinsichtlich der Ziele von Imputationsverfahren zu Skepsis seitens der potentiellen Anwender (Bedeutet Imputation nicht ein Erfinden von Daten?).
Ziel des Kurses ist es, den Teilnehmern zu vermitteln, warum es wichtig ist, Antwortausfälle (nonresponse) zu berücksichtigen und Klarheit darüber zu schaffen, welche Ziele ein brauchbares Imputationsverfahren anstreben sollte (und welche nicht). Der Hauptfokus des Workshops liegt auf dem Verfahren der multiplen Imputation, welches allgemein als das geeignetste Verfahren zum Umgang mit Antwortausfällen in Befragungen gilt. Der Workshop stellt das Verfahren der multiplen Imputation vor und legt dar, welche Vorteile es gegenüber dem Verfahren der einfachen Imputation bietet. Darüber hinaus werden verschiedene Imputationsmodelle vorgestellt. Schließlich werden Methoden präsentiert, welche eine Evaluation der Qualität der verschiedenen Modellierungsverfahren erlauben.
Die praktische Umsetzung des Verfahrens wird anhand mehrerer Beispiele in den Softwareprogrammen R und Stata illustriert.


Zielgruppe

Der Kurs ist geeignet für alle Forscher, die mit partiellem Antwortausfall (item non-response) konfrontiert sind und die starken Restriktionen in der Datenanalyse umgehen wollen, die sich aus der Nichtberücksichtigung der Antwortausfälle ergeben.


Lernziel

Die Teilnehmer lernen die Nachteile und potentiellen Gefahren des so genannten Available Case Analyse (Löschen sämtlicher Beobachtungen mit fehlenden Werten) kennen, die standardmäßig in allen Softwareprogrammen (SPSS, SAS, STATA, R) zur Datenanalyse verwendet wird. Des Weiteren lernen Sie, in welchen Situationen eine Imputation der fehlenden Werte hilfreich sein kann und warum das Verfahren der multiplen Imputation generell der einfachen Imputation (single imputation) vorzuziehen ist. Schließlich lernen die Teilnehmer, wie sie selbst multiple Imputationsverfahren entwickeln und durchführen und die Qualität verschiedener Imputationsverfahren vergleichen können.


Voraussetzungen

Die Teilnehmer sollten ein gutes Hintergrundwissen in multivariater Statistik haben. Grundwissen in Bayes-Statistik und Markov-Chain-Monte-Carlo-Verfahren (MCMC-Verfahren) ist von Vorteil, wird aber nicht vorausgesetzt. Die praktischen Beispiele werden mit Hilfe der Statistikprogramme STATA und R illustriert. Grundwissen in zumindest einem der beiden Programme wird vorausgesetzt. Das Kursmaterial ist auf Englisch.


Zeitplan

Literaturempfehlungen

Referenteninformationen

Weitere Informationen