Het voor het eerst analyseren van kwalitatieve data kan bij beginnende onderzoekers nogal wat verwarring oproepen. Mystificatie over hoe data te analyseren kan worden versterkt bij het lezen van gepubliceerde presentaties van onderzoek waarin beschrijvingen van wat auteurs feitelijk deden met hun data om “bevindingen” te produceren zowel beperkt als ondoorzichtig zijn. Een van de redenen voor de ondoorzichtigheid van beschrijvingen van het analytische proces is dat onderzoekers letterlijk met gegevens hebben gedacht in een iteratief en recursief proces dat letterlijk heen en weer gaat tussen gegevens, theorie, en ander onderzoek. Het gedetailleerd beschrijven van dit proces past niet bij wat in tijdschriftartikelen wordt verwacht aan logisch georganiseerde en beknopte beschrijvingen van onderzoeksprocessen. Hoe dan ook, er zijn genoeg manieren om aan de slag te gaan met de analyse van kwalitatieve data als dit een nieuwe taak is. In deze blogpost zal ik het een beetje hebben over voorlopige codering, omdat dat veel gebruikt wordt onder kwalitatieve onderzoekers.
Data-analyse is theoretisch geïnformeerd, en elke benadering van de analyse van gegevens zal afhangen van de theoretische benadering die voor een studie wordt gebruikt. Hoewel “codering” als praktijk de laatste tijd veel kritiek heeft gekregen (bv. St. Pierre, 2011), is het een – maar niet de enige – manier om de dataset binnen te dringen en een eerste indruk te krijgen van wat er aan de hand is. Wat is codering? Wetenschappers definiëren al tientallen jaren wat ze bedoelen met “coderen”. Hieronder volgen enkele definities van wetenschappers die hebben geschreven over het analyseren van kwalitatieve gegevens:
“Codes zijn labels of etiketten om betekenis toe te kennen aan de beschrijvende of inferentiële informatie die tijdens een onderzoek is verzameld. Codes worden gewoonlijk gekoppeld aan “brokken” van verschillende grootte – woorden, zinsdelen, zinnen, of hele paragrafen, al dan niet verbonden met een specifieke setting” (Miles & Huberman, 1994, p. 56).
Het proces van coderen houdt voor Corbin en Strauss in “het afleiden en ontwikkelen van concepten uit gegevens” (Corbin & Strauss, 2008, p. 65).
“Codering betekent het benoemen van segmenten van gegevens met een label dat tegelijkertijd elk stuk gegevens categoriseert, samenvat en verantwoordt. Codering is de eerste stap om voorbij concrete verklaringen in de gegevens te komen en analytische interpretaties te maken”(Charmaz, 2006, p. 43).
“De essentie van codering is het proces van het sorteren van je gegevens in verschillende categorieën die ze ordenen en betekenisvol maken vanuit het gezichtspunt van een of meer kaders of ideeënreeksen.” (Lofland, Snow, Anderson, & Lofland, 2006, p. 200).
Simpel gezegd is “codering” een proces waarbij onderzoekers de “betekenissen” synthetiseren die worden aangetoond in gegevensbronnen (of dit nu transcripties van interviews zijn, natuurlijk voorkomende gegevens, veldnotities, documenten, of visuele gegevens) door het gebruik van een soort “label”. Labels kunnen worden afgeleid uit de gegevens zelf wanneer de eigen woorden van de deelnemers worden gebruikt (d.w.z. “in vivo”), kunnen worden toegepast door de onderzoekers om samen te vatten wat is waargenomen, of kunnen deductief worden afgeleid uit de bredere onderzoeksdoelen en de literatuur die de studie informeert.
Ontwikkel een gegevensinventaris
Marie Kondo helpt ons onze huizen op te ruimen; gegevensinventarissen helpen ons de inventaris op te maken van wat onze gegevensreeks omvat. Data-inventarisaties kunnen ons helpen bij het organiseren van projectmateriaal. Voor wie graag met papier werkt, betekent dit dat de dataset wordt afgedrukt (transcripties van interviews, veldnotities van observaties, documenten enz.), en zo wordt georganiseerd dat de gegevens gemakkelijk toegankelijk zijn. Zo organiseerde ik mijn datasets toen ik voor het eerst kwalitatief onderzoek ging doen. Nu organiseer ik digitale versies van projectdocumenten eerder in mappen op mijn computer. Ik gebruik meestal een spreadsheet met wachtwoordbeveiliging om bij te houden welke verschillende gegevensbronnen ik heb, samen met de data waarop de gegevens zijn gegenereerd en/of verzameld, en eventuele transformatieprocessen die daarmee gepaard zijn gegaan (bv. transcriptie enz.). In dit bestand kan ik de namen van de deelnemers opnemen, samen met de gebruikte pseudoniemen.
Wanneer ik een gegevensinventaris opstel, bevat deze doorgaans de volgende elementen:
- Onderzoeker(s)
- Beschrijving van het onderzoek
- Doel van het onderzoek
- Onderzoeksvragen
- Definitie van termen (indien van toepassing)
- Opzet en methoden van het onderzoek
- IRB-procedures (is dit een pilotstudie met een goedgekeurde IRB? Een IRB die is goedgekeurd voor een cursus? Gegevens van een IRB van een andere onderzoeker?)
- Deelnemers (Hoeveel? Hoe werden ze gerekruteerd? Welke criteria werden gebruikt voor de steekproeftrekking?)
- Duur van het onderzoek (Wanneer werd het onderzoek uitgevoerd, en wat was de duur van het onderzoek?)
- Gegevensbeschrijving (over hoeveel gegevens beschikt u?)
- transcripties van interviews/video (duur van de interviews)
- documenten &archiefmateriaal (Lijst van documenten; hoeveel?)
- veldnotities (verkort, uitgebreid; hoeveel pagina’s?)
- audio-/visueel materiaal
- Onderzoekscontext: Beschrijf de context van uw onderzoek en de instellingen, indien van toepassing
- Bijlagen, indien van toepassing:
- Grafiek met samenvatting van gegevens (aantal pagina’s, datum van verzameling, deelnemers, enz.)
- Gegevensmonster (bijv. 1 volledig transcript; monster van archiefgegevens)
Beginnen met lezen en herlezen
De enige manier om met de gegevensanalyse te beginnen, is te beginnen met het lezen en herlezen van de verzamelde gegevens. Onderzoekers die audio- of video-opnamen van interviews of natuurlijk voorkomende interactie transcriberen bevinden zich in een goede positie, omdat zij al zorgvuldig naar hun audiobestanden hebben geluisterd, en een goed gevoel moeten hebben ontwikkeld voor wat er in de gegevensbron te vinden is. Wanneer de gegevensverzamelingen zeer groot zijn, kan het helpen om audio- of videomateriaal eerst te “indexeren”. Dit betekent dat een “index” of korte beschrijving (in plaats van een transcriptie) wordt gemaakt van wat is opgenomen in een audio- of video-opname, samen met tijdstempels. Dit is nuttig voor het lokaliseren van specifieke gebeurtenissen of momenten in een gegevensbron om deze tijdens het analytische proces opnieuw te bekijken of om verdere transcriptie van geselecteerde interacties binnen de grotere dataset te voltooien.
Voorbereidend coderen
Coding als proces wordt al tientallen jaren beschreven in talrijke teksten (Coffey & Atkinson, 1996; Huberman & Miles, 1994; Miles, Huberman, & Saldaña, 2014). De beginnende onderzoekers die de eerste codering uitvoeren, staan verschillende uitdagingen te wachten. Ten eerste is er “niet één juiste manier” om initieel te coderen. Ten tweede zijn er allerlei benaderingen om dezelfde set gegevens te coderen, en sommige onderzoekers hebben coderingsschema’s ontwikkeld die door anderen zouden kunnen worden toegepast. Bijvoorbeeld, Bogdan & Biklen’s (2003, pp. 162-168) schema omvat de volgende coderingscategorieën:
- Setting/Context
- Definitie van de situatie
- Perspectieven van de subjecten
- De denkwijzen van de deelnemers over mensen & objecten
- Proces
- Activiteiten
- Events
- Strategieën
- Relaties en sociale structuur
- Narratief
- Methodieken
Derde, Codering wordt gebruikt door onderzoekers die hun proces beschrijven als “thematische analyse” (Braun & Clarke, 2006) samen met degenen die “grounded theory” benaderingen omhelzen (Charmaz, 2014; Corbin & Strauss, 2015; Glaser & Strauss, 1967). Hoewel de processen in grote lijnen overeenkomsten vertonen, hebben geaarde theoretici specifieke benaderingen gedetailleerd om een “geaarde theorie” te ontwikkelen die niet typisch worden gebruikt in thematische benaderingen van analyse.
Ontwikkel een codewoordenboek
Bij het starten kan het helpen om bij te houden wat er gaande is door een “codewoordenboek” te ontwikkelen waarin elk van de gebruikte labels of codes wordt gedefinieerd. Dit betekent dat de parameters moeten worden opgeschreven aan de hand waarvan een bepaalde code op gegevens wordt toegepast – d.w.z. insluitings- en uitsluitingscriteria. In dit verband is het nuttig ook een uittreksel van gegevens op te nemen om te illustreren hoe de code is toegepast. Ik vind de volgende indeling voor het bijhouden van de eerste codering nuttig:
Code | Code-definitie | Illustratief uittreksel |
Zodra de eerste codes zijn toegepast, is het mogelijk deze te reorganiseren in een soort grotere groeperingen. Aangezien dit een vroeg stadium is in het analytische proces, kan dit proces worden gezien als een fase waarin de codes worden “uitgeprobeerd”. Ga na of er labels (of categorieën) zijn die kunnen worden gebruikt om de groep voorlopige codes te beschrijven. Op dit punt is het echt nuttig om te beginnen met het schrijven van “memo’s.”
Memo’s schrijven
Ik heb elders geschreven over het schrijven van memo’s – dit is een proces waarbij onderzoekers beginnen te schrijven over de gegevens, de codes, en de categorieën. Door het schrijven van memo’s kan men vragen stellen over de gegevens, nadenken over wat belangrijk is in de gegevens, en misschien overwegen hoe de verschillende codes zich tot elkaar zouden kunnen verhouden. Hier kan ook een uittreksel van de gegevensreeks worden gebruikt om over te schrijven. De sleutel hier is het opschrijven van iemands eerste gedachten en betekenisgeving.
Wat ik hier heb beschreven zijn de eerste processen die kunnen worden gebruikt om een gegevensverzameling te onderzoeken. Dit is zeker niet het einde van het proces van gegevensanalyse. Maar wat is het volgende? Ik denk dat het antwoord op die vraag afhangt van het specifieke project, van wat de onderzoeker wil bereiken, en dat het noodzakelijkerwijs inhoudt dat wordt teruggegrepen op de literatuur die bij de ontwikkeling van de studie is gebruikt, en op literatuur die betrekking heeft op de ontologische, epistemologische en theoretische perspectieven die men in een bepaalde studie inneemt.
Hier volgen enkele andere tips voor het analyseren van gegevens:
Hanteren van angst en bezorgdheid bij inductieve analyse van kwalitatieve gegevens
11 “trucs” om mee te denken bij het analyseren van gegevens
Kathy Roulston
Braun, V., & Clarke, V. (2006). Het gebruik van thematische analyse in de psychologie. Kwalitatief Onderzoek in de Psychologie, 3(2), 77-101. doi:10.1191/1478088706qp063oa
Charmaz, K. (2006). Constructing grounded theory: A practical guide through qualitative analysis. Thousand Oaks, CA: Sage.
Charmaz, K. (2014). Constructing grounded theory (2nd ed.). Los Angeles: Sage.
Coffey, A., & Atkinson, P. (1996). Making sense of qualitative data: Complementary research strategies. Thousand Oaks: Sage.
Corbin, J., & Strauss, A. (2008). Basics of qualitative research (3rd ed.). Los Angeles: Sage.
Corbin, J., & Strauss, A. (2015). Basics of qualitative research: Techniques and procedures for developing grounded theory (4th ed.). Los Angeles: Sage
Glaser, B. G., & Strauss, A. L. (1967). De ontdekking van de geaarde theorie: Strategies for qualitative research. New York: Aldine de Gruyter.
Huberman, A. M., & Miles, M. B. (1994). Gegevensbeheer en analysemethoden. In N. K. Denzin & Y. S. Lincoln (Eds.), Handbook of qualitative research (pp. 428-444). Thousand Oaks: Sage.
Lofland, J., Snow, D., Anderson, L., & Lofland, L. H. (2006). Het analyseren van sociale settings: A guide to qualitative observation and analysis (4th ed.). Belmont, CA: Thomson, Wadsworth.
Miles, M. B., & Huberman, A. M. (1994). Kwalitatieve data-analyse: An expanded sourcebook (2nd ed.). Thousand Oaks, CA: Sage.