Die erstmalige Analyse qualitativer Daten kann bei Neulingen in der Forschung zu großer Verwirrung führen. Die Verwirrung darüber, wie die Daten zu analysieren sind, kann noch verstärkt werden, wenn man veröffentlichte Forschungsberichte liest, in denen nur begrenzt und undurchsichtig beschrieben wird, was die Autoren tatsächlich mit ihren Daten gemacht haben, um „Erkenntnisse“ zu gewinnen. Einer der Gründe für die Undurchsichtigkeit der Beschreibungen des Analyseprozesses ist, dass die Forscher buchstäblich in einem iterativen und rekursiven Prozess mit den Daten gearbeitet haben, der buchstäblich zwischen den Daten, der Theorie und anderen Forschungen hin und her geht. Die detaillierte Beschreibung dieses Prozesses entspricht nicht dem, was in Zeitschriftenartikeln für logisch organisierte und prägnante Beschreibungen von Forschungsprozessen erwartet wird. Auf jeden Fall gibt es viele Möglichkeiten, mit der Analyse qualitativer Daten zu beginnen, wenn dies eine neue Aufgabe ist. In diesem Blogpost werde ich ein wenig über vorläufiges Kodieren sprechen, da dies unter qualitativen Forschern weit verbreitet ist.
Die Datenanalyse ist theoretisch geprägt, und jeder Ansatz zur Datenanalyse hängt von dem theoretischen Ansatz ab, der für eine Studie verwendet wird. Obwohl das „Kodieren“ als Praxis in letzter Zeit viel Kritik erfahren hat (z. B. St. Pierre, 2011), ist es eine – aber nicht die einzige – Möglichkeit, in den Datensatz einzudringen, um einen ersten Eindruck davon zu gewinnen, was vor sich geht. Zunächst einmal: Was ist Kodierung? Wissenschaftler haben jahrzehntelang definiert, was sie mit „Kodierung“ meinen. Hier einige Definitionen von Wissenschaftlern, die über die Analyse qualitativer Daten geschrieben haben:
„Codes sind Markierungen oder Etiketten, mit denen den in einer Studie gesammelten beschreibenden oder schlussfolgernden Informationen Bedeutungseinheiten zugewiesen werden. Codes werden in der Regel an „Brocken“ unterschiedlicher Größe angehängt – Wörter, Phrasen, Sätze oder ganze Absätze, die mit einer bestimmten Einstellung verbunden sind oder nicht“ (Miles & Huberman, 1994, S. 56).
Der Prozess des Kodierens beinhaltet für Corbin und Strauss das „Ableiten und Entwickeln von Konzepten aus den Daten“ (Corbin & Strauss, 2008, S. 65).
„Kodieren bedeutet, Segmente von Daten mit einem Etikett zu benennen, das gleichzeitig kategorisiert, zusammenfasst und für jeden Teil der Daten verantwortlich ist. Das Kodieren ist der erste Schritt, um über die konkreten Aussagen in den Daten hinaus zu analytischen Interpretationen zu gelangen“ (Charmaz, 2006, S. 43).
„Das Wesen des Kodierens ist der Prozess des Sortierens Ihrer Daten in verschiedene Kategorien, die sie organisieren und aus dem Blickwinkel eines oder mehrerer Rahmen oder Gedankensätze sinnvoll machen.“ (Lofland, Snow, Anderson, & Lofland, 2006, S. 200).
Vereinfacht ausgedrückt ist „Kodierung“ ein Prozess, durch den Forscher die „Bedeutungen“, die in Datenquellen (ob es sich nun um Transkripte von Interviews, natürlich vorkommende Daten, Feldnotizen, Dokumente oder visuelle Daten handelt) gezeigt werden, durch die Verwendung einer Art von „Etikett“ zusammenfassen. Etiketten können aus den Daten selbst abgeleitet werden, wenn die eigenen Worte der Teilnehmer verwendet werden (d.h. „in vivo“), sie können von den Forschern angewandt werden, um das Beobachtete zusammenzufassen, oder sie können deduktiv aus den umfassenderen Forschungszielen und der Literatur abgeleitet werden, die der Studie zugrunde liegen.
Entwickeln Sie ein Dateninventar
Marie Kondo hilft uns, unser Haus aufzuräumen; Dateninventare helfen uns, eine Bestandsaufnahme dessen zu machen, was unser Datensatz umfasst. Dateninventare können uns beim Organisieren von Projektmaterialien helfen. Für diejenigen, die gerne mit Papier arbeiten, bedeutet dies, dass der Datensatz ausgedruckt wird (Mitschriften von Interviews, Feldnotizen von Beobachtungen, Dokumente usw.) und so organisiert wird, dass die Daten leicht zugänglich sind. So habe ich meine Datensätze organisiert, als ich mit der qualitativen Forschung begann. Heute organisiere ich die digitalen Versionen der Projektdokumente eher in Ordnern auf meinem Computer. In der Regel verwende ich eine passwortgeschützte Tabelle, um die verschiedenen Datenquellen, die mir zur Verfügung stehen, zusammen mit den Daten, an denen die Daten generiert und/oder gesammelt wurden, und etwaigen Transformationsprozessen (z. B. Transkription usw.) zu erfassen. In dieser Datei kann ich die Namen der Teilnehmer zusammen mit den verwendeten Pseudonymen aufführen.
Wenn ich ein Dateninventar erstelle, enthält es in der Regel die folgenden Elemente:
- Forscher/s
- Studienbeschreibung
- Forschungszweck
- Forschungsfragen
- Definition von Begriffen (falls zutreffend)
- Studiendesign und Methoden
- IRB-Verfahren (handelt es sich um eine Pilotstudie mit einem genehmigten IRB? Ein von einem Kurs genehmigtes IRB? Daten vom IRB eines anderen Forschers?)
- Teilnehmer (Wie viele? Wie wurden sie rekrutiert? Welche Kriterien wurden für die Stichprobenziehung verwendet?)
- Studiendauer (Wann wurde die Studie durchgeführt, und wie lange dauerte sie?)
- Datenbeschreibung (wie viele Daten liegen vor?)
- Transkripte von Interviews/Video (Dauer der Interviews)
- Dokumente &Archivmaterial (Liste der Dokumente; wie viele?)
- Feldnotizen (gekürzt, erweitert; wie viele Seiten?)
- Audio-/Videomaterial
- Forschungskontext: Beschreiben Sie gegebenenfalls den Kontext Ihrer Studie und die Rahmenbedingungen
- Anhänge, soweit zutreffend:
- Tabelle mit Zusammenfassung der Daten (Anzahl der Seiten, Erhebungsdatum, Teilnehmer usw.)
- Datenprobe (z. B. 1 vollständiges Transkript; Probe von Archivdaten)
Mit dem Lesen und Wiederlesen beginnen
Der einzige Weg, mit der Datenanalyse zu beginnen, ist das Lesen und Überprüfen der gesammelten Daten. Forscher, die Audio- oder Videoaufzeichnungen von Interviews oder natürlich vorkommenden Interaktionen transkribieren, sind in einer guten Position, da sie sich ihre Audiodateien bereits sorgfältig angehört haben und ein gutes Gefühl dafür entwickelt haben sollten, was in der Datenquelle zu finden ist. Bei sehr großen Datensätzen kann es hilfreich sein, eine erste „Indexierung“ des Audio- oder Videomaterials vorzunehmen. Das bedeutet, dass ein „Index“ oder eine kurze Beschreibung (anstelle einer Transkription) des Inhalts einer Audio- oder Videoaufzeichnung erstellt wird, zusammen mit Zeitstempeln. Dies ist nützlich, um bestimmte Ereignisse oder Momente in einer Datenquelle zu lokalisieren, um sie während des Analyseprozesses zu überprüfen oder eine weitere Transkription ausgewählter Interaktionen innerhalb des größeren Datensatzes zu vervollständigen.
Vorläufige Kodierung
Die Kodierung als Prozess wird seit Jahrzehnten in zahlreichen Texten beschrieben (Coffey & Atkinson, 1996; Huberman & Miles, 1994; Miles, Huberman, & Saldaña, 2014). Auf den Forschungsanfänger, der eine erste Kodierung vornimmt, warten mehrere Herausforderungen. Erstens gibt es „nicht den einen richtigen Weg“, um eine Erstkodierung durchzuführen. Zweitens gibt es alle möglichen Ansätze, um denselben Datensatz zu kodieren, und einige Forscher haben Kodierschemata entwickelt, die von anderen angewendet werden können. Das Schema von Bogdan & Biklen (2003, pp. 162-168) ein Schema mit den folgenden Kodierkategorien:
- Setting/Kontext
- Definition der Situation
- Perspektiven der Subjekte
- Denkweisen der Teilnehmer über Personen & Objekte
- Prozess
- Aktivitäten
- Ereignisse
- Strategien
- Beziehungen und soziale Struktur
- Narrative
- Methoden
Drittes, Das Kodieren wird von Forschern verwendet, die ihr Verfahren als „thematische Analyse“ (Braun & Clarke, 2006) bezeichnen, ebenso wie von solchen, die einen „grounded theory“-Ansatz verfolgen (Charmaz, 2014; Corbin & Strauss, 2015; Glaser & Strauss, 1967). Obwohl die Prozesse große Ähnlichkeiten aufweisen, haben die „grounded theorists“ spezifische Ansätze zur Entwicklung der „grounded theory“ entwickelt, die in der Regel nicht in thematischen Analyseansätzen verwendet werden.
Entwickeln Sie ein Code-Wörterbuch
Zu Beginn kann es hilfreich sein, den Überblick zu behalten, indem Sie ein „Code-Wörterbuch“ entwickeln, in dem jede der verwendeten Bezeichnungen oder Codes definiert ist. Das bedeutet, dass die Parameter, nach denen ein bestimmter Code auf die Daten angewandt wird – d. h. die Ein- und Ausschlusskriterien – aufgeschrieben werden. Dabei ist es hilfreich, auch einen Datenauszug beizufügen, um die Anwendung des Codes zu veranschaulichen. Ich finde das folgende Format hilfreich, um den Überblick über die anfängliche Kodierung zu behalten:
Code | Code-Definition | Illustrativer Auszug |
Nachdem die anfänglichen Codes angewandt wurden, ist es möglich, diese in einige größere Gruppierungen umzuorganisieren. Da sich dieser Prozess noch in einem frühen Stadium des Analyseprozesses befindet, könnte man ihn eher als eine Art „Ausprobierphase“ betrachten. Überlegen Sie, ob es Bezeichnungen (oder Kategorien) gibt, die zur Beschreibung der Gruppe der vorläufigen Codes verwendet werden könnten. An diesem Punkt ist es wirklich nützlich, mit dem Schreiben von „Memos“ zu beginnen.
Schreiben Sie Memos
Ich habe an anderer Stelle über das Schreiben von Memos geschrieben – dies ist ein Prozess, bei dem Forscher beginnen, über die Daten, Codes und Kategorien zu schreiben. Beim Schreiben von Memos kann man Fragen zu den Daten stellen, überlegen, was in den Daten wichtig ist, und vielleicht überlegen, wie sich die verschiedenen Codes zueinander verhalten könnten. Dabei kann man auch einen Auszug aus dem Datensatz verwenden, über den man schreibt. Das Wichtigste dabei ist, dass man seine ersten Gedanken und Bedeutungen aufschreibt.
Was ich hier beschrieben habe, sind die ersten Prozesse, die man zur Untersuchung eines Datensatzes verwenden kann. Damit ist der Prozess der Datenanalyse keineswegs abgeschlossen. Aber wie geht es weiter? Ich denke, die Antwort auf diese Frage hängt von dem jeweiligen Projekt ab, von dem, was der Forscher erreichen will, und wird notwendigerweise einen Rückgriff auf die Literatur beinhalten, die an der Entwicklung der Studie beteiligt war, sowie auf die Literatur, die sich mit den ontologischen, epistemologischen und theoretischen Perspektiven beschäftigt, die man in einer bestimmten Studie einnimmt.
Hier sind einige weitere Tipps für die Datenanalyse:
Management von Furcht und Angst bei der induktiven Analyse qualitativer Daten
11 „Tricks“ zum Nachdenken bei der Datenanalyse
Kathy Roulston
Braun, V., & Clarke, V. (2006). Die Anwendung der thematischen Analyse in der Psychologie. Qualitative Research in Psychology, 3(2), 77-101. doi:10.1191/1478088706qp063oa
Charmaz, K. (2006). Constructing grounded theory: A practical guide through qualitative analysis. Thousand Oaks, CA: Sage.
Charmaz, K. (2014). Constructing grounded theory (2nd ed.). Los Angeles: Sage.
Coffey, A., & Atkinson, P. (1996). Making sense of qualitative data: Complementary research strategies. Thousand Oaks: Sage.
Corbin, J., & Strauss, A. (2008). Grundlagen der qualitativen Forschung (3. Aufl.). Los Angeles: Sage.
Corbin, J., & Strauss, A. (2015). Basics of qualitative research: Techniken und Verfahren zur Entwicklung einer geerdeten Theorie (4. Aufl.). Los Angeles: Sage
Glaser, B. G., & Strauss, A. L. (1967). The discovery of grounded theory: Strategies for qualitative research. New York: Aldine de Gruyter.
Huberman, A. M., & Miles, M. B. (1994). Data management and analysis methods. In N. K. Denzin & Y. S. Lincoln (Eds.), Handbook of qualitative research (pp. 428-444). Thousand Oaks: Sage.
Lofland, J., Snow, D., Anderson, L., & Lofland, L. H. (2006). Analyzing social settings: A guide to qualitative observation and analysis (4. Aufl.). Belmont, CA: Thomson, Wadsworth.
Miles, M. B., & Huberman, A. M. (1994). Qualitative Data Analysis: An expanded sourcebook (2nd ed.). Thousand Oaks, CA: Sage.