Analyse af kvalitative data for første gang kan give anledning til en del forvirring blandt nybegyndere. Mystikken omkring hvordan man skal begynde at analysere data kan blive forstærket, når man læser offentliggjorte præsentationer af forskning, hvor beskrivelserne af, hvad forfatterne faktisk gjorde med deres data for at producere “resultater”, er både begrænsede og uigennemsigtige. En af grundene til, at beskrivelserne af den analytiske proces er så uigennemsigtige, er, at forskerne bogstaveligt talt har tænkt med data i en iterativ og rekursiv proces, som bogstaveligt talt går frem og tilbage mellem data, teori og anden forskning. At beskrive denne proces i detaljer passer ikke med det, der forventes i tidsskriftsartikler om logisk organiserede og kortfattede beskrivelser af forskningsprocesser. Under alle omstændigheder er der masser af måder at komme i gang med analysen af kvalitative data på, hvis dette er en ny opgave. I dette blogindlæg vil jeg tale lidt om foreløbig kodning, da det er meget udbredt blandt kvalitative forskere.
Dataanalyse er teoretisk informeret, og enhver tilgang til analyse af data vil afhænge af den teoretiske tilgang, der anvendes til en undersøgelse. Selv om “kodning” som praksis har fået en del kritik på det seneste (f.eks. St. Pierre, 2011), er det en – men ikke den eneste – måde at komme ind i datasættet på for at få en første fornemmelse af, hvad der foregår. Først, hvad er kodning? Forskere har i årtier defineret, hvad de mener med “kodning”. Her er flere definitioner fremsat af forskere, der har skrevet om analyse af kvalitative data:
“Koder er tags eller etiketter til at tildele betydningsenheder til de deskriptive eller inferentielle oplysninger, der er indsamlet i løbet af en undersøgelse. Koder er normalt knyttet til “bidder” af varierende størrelse – ord, sætninger, sætninger eller hele afsnit, der er forbundet eller ikke forbundet med en specifik indstilling” (Miles & Huberman, 1994, s. 56).
Processen med kodning indebærer for Corbin og Strauss at “udlede og udvikle begreber fra data” (Corbin & Strauss, 2008, s. 65).
“Kodning betyder at navngive segmenter af data med en etiket, der samtidig kategoriserer, opsummerer og redegør for hvert stykke data. Kodning er det første skridt til at bevæge sig ud over konkrete udsagn i dataene og foretage analytiske fortolkninger.” (Charmaz, 2006, s. 43).
“Essensen af kodning er processen med at sortere dine data i forskellige kategorier, der organiserer dem og gør dem meningsfulde ud fra et eller flere rammer eller sæt af idéer.” (Lofland, Snow, Anderson, & Lofland, 2006, s. 200).
Simpelt sagt er “kodning” en proces, hvorved forskere syntetiserer de “betydninger”, der demonstreres i datakilder (uanset om disse er udskrifter af interviews, naturligt forekommende data, feltnoter, dokumenter eller visuelle data) ved hjælp af en eller anden form for “etiket”. Etiketter kan udledes af selve dataene, når deltagernes egne ord anvendes (dvs. “in vivo”), de kan anvendes af forskerne for at opsummere det observerede, eller de kan udledes deduktivt fra de bredere forskningsmål og den litteratur, der informerer undersøgelsen.
Udarbejd en dataopgørelse
Marie Kondo hjælper os med at rydde op i vores huse; dataopgørelser hjælper os med at gøre status over, hvad vores datasæt omfatter. Dataopgørelser kan hjælpe os med at organisere projektmaterialer. For dem, der kan lide at arbejde med papir, vil det betyde, at datasættet bliver udskrevet (udskrifter af interviews, feltnoter af observationer, dokumenter osv.) og organiseret på en måde, der gør dataene let tilgængelige. Det er sådan, jeg plejede at organisere mine datasæt, da jeg først begyndte at lave kvalitativ forskning. Nu er jeg mere tilbøjelig til at organisere digitale versioner af projektdokumenter i mapper på min computer. Jeg bruger typisk et adgangskodebeskyttet regneark til at holde styr på de forskellige datakilder, jeg har, sammen med de datoer, hvor data blev genereret og/eller indsamlet, og eventuelle transformationsprocesser, der har været involveret (f.eks. transskription osv.). I denne fil kan jeg medtage deltagernes navne sammen med de anvendte pseudonymer.
Når jeg udarbejder en dataopgørelse, har den typisk følgende elementer:
- Forsker(e)
- Undersøgelsesbeskrivelse
- Forskningsformål
- Forskningsspørgsmål
- Definition af begreber (hvis relevant)
- Studieopbygning og metoder
- IRB-procedurer (er dette en pilotundersøgelse med en godkendt IRB? Et kursus-godkendt IRB? Data fra en anden forskers IRB?)
- Undersøgelsens varighed (Hvornår blev undersøgelsen gennemført, og hvad var undersøgelsens varighed?)
- Databeskrivelse (Hvor mange data har du?)
Deltagere (Hvor mange? Hvordan blev de rekrutteret? Hvilke kriterier blev anvendt til udtagning af stikprøver?)
- udskrifter af interviews/video (varighed af interviews)
- dokumenter &arkivmateriale (Liste over dokumenter; hvor mange?)
- feltnoter (kondenseret, udvidet; hvor mange sider?)
- lyd-/visuelt materiale
- Forskningskontekst: Beskriv konteksten for din undersøgelse og indstillinger, hvor det er relevant
- Bilag, hvor det er relevant:
- Diagram med oversigt over data (antal sider, indsamlingsdato, deltagere osv.)
- Datastikprøve (f.eks. 1 fuld udskrift; stikprøve af arkivdata)
Start læsning og genlæsning
Den eneste måde at starte dataanalysen på er at begynde at læse og gennemgå de indsamlede data. Forskere, der transskriberer lyd- eller videooptagelser af interviews eller naturligt forekommende interaktion, er i en god position, da de allerede har lyttet omhyggeligt til deres lydfiler og burde have udviklet en god fornemmelse af, hvad der findes i datakilden. Når datasættene er meget store, kan det være en hjælp at foretage en indledende “indeksering” af lyd- eller videomaterialet. Det betyder, at der oprettes et “indeks” eller en kort beskrivelse (snarere end en transskription) af, hvad der er indeholdt i en lyd- eller videooptagelse, sammen med tidsstempler. Dette er nyttigt til at lokalisere specifikke begivenheder eller øjeblikke i en datakilde for at gennemgå den under den analytiske proces eller færdiggøre yderligere transskription af udvalgte interaktioner inden for det større datasæt.
Preliminaire kodning
Kodning som en proces er blevet beskrevet i årtier i talrige tekster (Coffey & Atkinson, 1996; Huberman & Miles, 1994; Miles, Huberman, & Saldaña, 2014). Flere udfordringer venter de nybegyndere forskere, der foretager den indledende kodning. For det første er der “ikke én rigtig måde” at foretage indledende kodning på. For det andet er der alle mulige tilgange til at kode det samme sæt data, og nogle forskere har udviklet kodningsskemaer, som kan anvendes af andre. F.eks. er Bogdan & Biklens (2003, pp. 162-168) skema omfatter følgende kodningskategorier:
- Setting/Context
- Definition af situationen
- Subjekternes perspektiver
- Deltagernes måder at tænke på om mennesker & objekter
- Processen
- Aktiviteter
- Hændelser
- Strategier
- Relationer og social struktur
- Fortælling
- Fortælling
- Metoder
Der tredje, kodning anvendes af forskere, der beskriver deres proces som “tematisk analyse” (Braun & Clarke, 2006) sammen med dem, der tilslutter sig “grounded theory”-tilgange (Charmaz, 2014; Corbin & Strauss, 2015; Glaser & Strauss, 1967). Selv om processerne har store ligheder, har grounded theorister detaljerede specifikke tilgange til at udvikle “grounded theory”, som typisk ikke anvendes i tematiske tilgange til analyse.
Udarbejd en kodeordbog
Når man starter, kan det hjælpe at holde styr på, hvad der foregår, ved at udvikle en “kodeordbog”, hvor hver af de anvendte etiketter eller koder er defineret. Det betyder, at man skriver de parametre ud, hvormed en bestemt kode anvendes på data – dvs. inklusions- og eksklusionskriterier. Her vil det være nyttigt også at medtage et uddrag af data for at illustrere, hvordan koden er blevet anvendt. Jeg finder følgende format til at holde styr på den indledende kodning nyttigt:
Kode | Kodedefinition | Illustrativt uddrag |
Når de indledende koder er blevet anvendt, er det muligt at omorganisere disse i nogle former for større grupperinger. Da dette er tidligt i den analytiske proces, kan denne proces måske mere ses som en “afprøvningsfase”. Overvej, om der er etiketter (eller kategorier), der kan bruges til at beskrive gruppen af foreløbige koder. Det er på dette tidspunkt, at det er virkelig nyttigt at begynde at skrive “memoer.”
Skriv memoer
Jeg har skrevet andetsteds om memo skrivning – dette er en proces, hvor forskerne begynder at skrive om data, koder og kategorier. Gennem memo writing kan man stille spørgsmål til dataene, overveje, hvad der er vigtigt i dataene, og måske overveje, hvordan de forskellige koder kan forholde sig til hinanden. Her kan man også inddrage et uddrag af datasættet, som man skriver om. Nøglen her er at nedskrive sine første tanker og sin meningsskabelse.
Det, jeg har beskrevet her, er de indledende processer, som man kan bruge til at udforske et datasæt. Dette er på ingen måde afslutningen på dataanalyseprocessen. Men hvor skal vi hen som det næste? Jeg tror, at svaret på det spørgsmål afhænger af det konkrete projekt, hvad forskeren ønsker at opnå, og det vil nødvendigvis indebære, at man går tilbage til den litteratur, der er involveret i udviklingen af undersøgelsen, samt litteratur, der beskæftiger sig med de ontologiske, epistemologiske og teoretiske perspektiver, som man indtager i en given undersøgelse.
Her er et par andre tips til analyse af data:
Håndtering af frygt og angst i induktiv analyse af kvalitative data
11 “tricks” til at tænke med, når man analyserer data
Kathy Roulston
Braun, V., & Clarke, V. (2006). Brug af tematisk analyse i psykologi. Qualitative Research in Psychology, 3(2), 77-101. doi:10.1191/1478088706qp063oa
Charmaz, K. (2006). Konstruktion af grounded theory: En praktisk vejledning gennem kvalitativ analyse. Thousand Oaks, CA: Sage.
Charmaz, K. (2014). Constructing grounded theory (2nd ed.). Los Angeles: Sage.
Coffey, A., & Atkinson, P. (1996). Making sense of qualitative data: Complementary research strategies. Thousand Oaks: Sage.
Corbin, J., & Strauss, A. (2008). Grundlæggende principper for kvalitativ forskning (3. udgave). Los Angeles: Sage.
Corbin, J., & Strauss, A. (2015). Grundlæggende principper for kvalitativ forskning: Teknikker og procedurer til udvikling af grounded theory (4th ed.). Los Angeles: Sage
Glaser, B. G., & Strauss, A. L. (1967). The discovery of grounded theory: Strategier for kvalitativ forskning. New York: Aldine de Gruyter.
Huberman, A. M., & Miles, M. B. (1994). Datahåndtering og analysemetoder. I N. K. Denzin & Y. S. Lincoln (Eds.), Handbook of qualitative research (pp. 428-444). Thousand Oaks: Sage.
Lofland, J., Snow, D., Anderson, L., & Lofland, L. H. (2006). Analyse af sociale sammenhænge: A guide to qualitative observation and analysis (4th ed.). Belmont, CA: Thomson, Wadsworth.
Miles, M. B., & Huberman, A. M. (1994). Kvalitativ dataanalyse: An expanded sourcebook (2nd ed.). Thousand Oaks, CA: Sage.