Analizar los datos cualitativos por primera vez puede suponer una gran confusión entre los investigadores noveles. La mitificación sobre cómo analizar los datos puede aumentar cuando se leen las presentaciones publicadas de la investigación, en las que las descripciones de lo que los autores realmente hicieron con sus datos para producir «hallazgos» son limitadas y opacas. Una de las razones de la opacidad de las descripciones del proceso analítico es que los investigadores han estado pensando literalmente con los datos en un proceso iterativo y recursivo que literalmente va y viene entre los datos, la teoría y otras investigaciones. Describir este proceso en detalle no encaja con lo que se espera en los artículos de las revistas para las descripciones lógicamente organizadas y concisas de los procesos de investigación. En cualquier caso, hay muchas formas de iniciarse en el análisis de datos cualitativos si se trata de una tarea nueva. En este blogpost, voy a hablar un poco sobre la codificación preliminar, ya que es ampliamente utilizado entre los investigadores cualitativos.
El análisis de datos es teóricamente informado, y cualquier enfoque para el análisis de los datos dependerá del enfoque teórico utilizado para un estudio. Aunque la «codificación» como práctica ha recibido una buena cantidad de críticas últimamente (por ejemplo, St. Pierre, 2011), es una -pero no la única- manera de entrar en el conjunto de datos para obtener un sentido inicial de lo que está sucediendo. En primer lugar, ¿qué es la codificación? Los especialistas llevan décadas definiendo lo que entienden por «codificación». He aquí varias definiciones propuestas por académicos que han escrito sobre el análisis de datos cualitativos:
«Los códigos son etiquetas para asignar unidades de significado a la información descriptiva o inferencial recopilada durante un estudio. Los códigos suelen adjuntarse a «trozos» de tamaño variable -palabras, frases, oraciones o párrafos enteros, conectados o no a un escenario específico» (Miles & Huberman, 1994, p. 56).
El proceso de codificación, para Corbin y Strauss implica «derivar y desarrollar conceptos a partir de los datos» (Corbin & Strauss, 2008, p. 65).
«Codificar significa nombrar segmentos de datos con una etiqueta que simultáneamente categoriza, resume y da cuenta de cada dato. La codificación es el primer paso para ir más allá de las afirmaciones concretas de los datos y hacer interpretaciones analíticas»(Charmaz, 2006, p. 43).
«La esencia de la codificación es el proceso de clasificar los datos en varias categorías que los organizan y les dan sentido desde el punto de vista de uno o más marcos o conjuntos de ideas.» (Lofland, Snow, Anderson, & Lofland, 2006, p. 200).
En pocas palabras, la «codificación» es un proceso mediante el cual los investigadores sintetizan los «significados» demostrados en las fuentes de datos (ya sean transcripciones de entrevistas, datos naturales, notas de campo, documentos o datos visuales) mediante el uso de algún tipo de «etiqueta». Las etiquetas pueden derivarse de los propios datos cuando se utilizan las palabras de los participantes (es decir, «in vivo»), pueden ser aplicadas por los investigadores para resumir lo que se observa o pueden derivarse deductivamente de los objetivos de investigación más amplios y de la literatura que informa el estudio.
Desarrollar un inventario de datos
Marie Kondo nos ayuda a ordenar nuestras casas; los inventarios de datos nos ayudan a hacer un balance de lo que abarca nuestro conjunto de datos. Los inventarios de datos pueden ayudarnos a organizar los materiales del proyecto. Para los que les gusta trabajar con papel, esto significará que el conjunto de datos se imprimirá (transcripciones de entrevistas, notas de campo de las observaciones, documentos, etc.), y se organizará de forma que los datos sean fácilmente accesibles. Así es como solía organizar mis conjuntos de datos cuando empecé a hacer investigación cualitativa. Ahora, es más probable que organice las versiones digitales de los documentos del proyecto en carpetas en mi ordenador. Suelo utilizar una hoja de cálculo protegida con contraseña para hacer un seguimiento de las diferentes fuentes de datos que tengo, junto con las fechas en las que se generaron y/o recopilaron los datos, y cualquier proceso de transformación que haya implicado (por ejemplo, transcripción, etc.). En este archivo, podría incluir los nombres de los participantes junto con los seudónimos utilizados.
Cuando redacto un inventario de datos, suele tener los siguientes elementos:
- Investigador/es
- Descripción del estudio
- Finalidad de la investigación
- Preguntas de la investigación
- Definición de términos (si procede)
- Diseño y métodos del estudio
- Procedimientos del CEI (¿se trata de un estudio piloto con un CEI aprobado? ¿Un CEI aprobado por el curso? ¿Datos del CEI de otro investigador?)
- Participantes (¿Cuántos? ¿Cómo fueron reclutados? Qué criterios se utilizaron para el muestreo?)
- Duración del estudio (¿Cuándo se realizó el estudio y cuál fue su duración?)
- Descripción de los datos (¿Cuántos datos tiene?)
- Transcripciones de entrevistas/vídeo (duración de las entrevistas)
- Material de archivo (Lista de documentos; ¿Cuántos?)
- Notas de campo (condensadas, ampliadas; ¿Cuántas páginas?)
- Material audiovisual
- Contexto de la investigación: Describa el contexto de su estudio y los escenarios según corresponda
- Apéndices según corresponda:
- Cuadro con resumen de datos (nº de páginas, fecha de recogida, participantes, etc.)
- Muestra de datos (por ejemplo, 1 transcripción completa; muestra de datos de archivo)
Comenzar a leer y releer
La única manera de comenzar el análisis de los datos es empezar a leer y revisar los datos recogidos. Los investigadores que transcriben las grabaciones de audio o vídeo de las entrevistas o de la interacción que se produce de forma natural se encuentran en una buena posición, puesto que ya han escuchado atentamente sus archivos de audio y deberían haber desarrollado un buen sentido de lo que se encuentra en la fuente de datos. Cuando los conjuntos de datos son muy grandes, puede ser útil realizar una «indexación» inicial de los materiales de audio o vídeo. Esto significa que se crea un «índice» o una breve descripción (en lugar de una transcripción) de lo que se incluye en una grabación de audio o vídeo, junto con las marcas de tiempo. Esto es útil para localizar eventos o momentos específicos en una fuente de datos para revisarlos durante el proceso analítico o completar la transcripción posterior de interacciones seleccionadas dentro del conjunto de datos más amplio.
Codificación preliminar
La codificación como proceso se ha descrito durante décadas en numerosos textos (Coffey & Atkinson, 1996; Huberman & Miles, 1994; Miles, Huberman, & Saldaña, 2014). Varios desafíos esperan a los investigadores novatos que realizan la codificación inicial. En primer lugar, no hay «una forma correcta» de realizar la codificación preliminar. En segundo lugar, hay todo tipo de enfoques para codificar el mismo conjunto de datos, y algunos investigadores han desarrollado esquemas de codificación que podrían ser aplicados por otros. Por ejemplo, el esquema de Bogdan & Biklen (2003, pp. 162-168) incluye las siguientes categorías de codificación:
- Establecimiento/Contexto
- Definición de la situación
- Perspectivas de los sujetos
- Modo de pensar de los participantes sobre las personas &objetos
- Proceso
- Actividades
- Eventos
- Estrategias
- Relaciones y estructura social
- Narrativa
- Métodos
Tercero, la codificación es utilizada por los investigadores que describen su proceso como «análisis temático»(Braun & Clarke, 2006) junto con los que adoptan enfoques de «teoría fundamentada» (Charmaz, 2014; Corbin & Strauss, 2015; Glaser & Strauss, 1967). Aunque los procesos tienen amplias similitudes, los teóricos fundamentados han detallado enfoques específicos para desarrollar la «teoría fundamentada» que no se suelen utilizar en los enfoques temáticos del análisis.
Desarrollar un diccionario de códigos
Cuando se empieza, puede ayudar a hacer un seguimiento de lo que está sucediendo el desarrollo de un «diccionario de códigos» en el que se define cada una de las etiquetas o códigos utilizados. Es decir, escribir los parámetros por los que se aplica un código concreto a los datos, es decir, los criterios de inclusión y exclusión. En este caso, será útil incluir también un extracto de los datos para ilustrar cómo se ha aplicado el código. Me parece útil el siguiente formato para seguir la codificación inicial:
Código | Definición del código | Extracto ilustrativo |
Una vez aplicados los códigos iniciales, es posible reorganizarlos en algunos tipos de agrupaciones más amplias. Dado que se trata de una fase temprana del proceso analítico, este proceso podría considerarse más como una fase de «prueba». Considere si hay etiquetas (o categorías) que puedan utilizarse para describir el grupo de códigos preliminares. Es en este punto en el que resulta realmente útil empezar a escribir «memos»
Escribir memos
He escrito en otra parte sobre la escritura de memos: se trata de un proceso en el que los investigadores empiezan a escribir sobre los datos, los códigos y las categorías. A través de la escritura de memos, uno puede hacer preguntas de los datos, considerar lo que es importante en los datos, y tal vez considerar cómo los diversos códigos podrían relacionarse entre sí. En este caso, también se puede incluir un extracto del conjunto de datos sobre el que escribir. La clave aquí es anotar los pensamientos iniciales y la creación de significado.
Lo que he descrito aquí son los procesos iniciales que podrían utilizarse para explorar un conjunto de datos. Esto no es en absoluto la conclusión del proceso de análisis de datos. Pero, ¿cuál es el siguiente paso? Creo que la respuesta a esa pregunta depende del proyecto particular, de lo que el investigador quiera lograr, y necesariamente implicará volver a la literatura involucrada en el desarrollo del estudio, así como a la literatura que se compromete con las perspectivas ontológicas, epistemológicas y teóricas que uno toma en cualquier estudio particular.
Aquí hay otros consejos para el análisis de datos:
Manejar el miedo y la ansiedad en el análisis inductivo de datos cualitativos
11 «trucos» con los que pensar cuando se analizan los datos
Kathy Roulston
Braun, V., & Clarke, V. (2006). Uso del análisis temático en psicología. Qualitative Research in Psychology, 3(2), 77-101. doi:10.1191/1478088706qp063oa
Charmaz, K. (2006). Construyendo la teoría fundamentada: Una guía práctica a través del análisis cualitativo. Thousand Oaks, CA: Sage.
Charmaz, K. (2014). Construyendo la teoría fundamentada (2ª ed.). Los Ángeles: Sage.
Coffey, A., & Atkinson, P. (1996). Making sense of qualitative data: Estrategias complementarias de investigación. Thousand Oaks: Sage.
Corbin, J., & Strauss, A. (2008). Fundamentos de la investigación cualitativa (3ª ed.). Los Ángeles: Sage.
Corbin, J., & Strauss, A. (2015). Fundamentos de la investigación cualitativa: Técnicas y procedimientos para desarrollar la teoría fundamentada (4ª ed.). Los Ángeles: Sage
Glaser, B. G., & Strauss, A. L. (1967). El descubrimiento de la teoría fundamentada: Estrategias para la investigación cualitativa. Nueva York: Aldine de Gruyter.
Huberman, A. M., & Miles, M. B. (1994). Métodos de gestión y análisis de datos. En N. K. Denzin & Y. S. Lincoln (Eds.), Handbook of qualitative research (pp. 428-444). Thousand Oaks: Sage.
Lofland, J., Snow, D., Anderson, L., & Lofland, L. H. (2006). Analizando entornos sociales: A guide to qualitative observation and analysis (4ª ed.). Belmont, CA: Thomson, Wadsworth.
Miles, M. B., & Huberman, A. M. (1994). Qualitative data analysis: An expanded sourcebook (2nd ed.). Thousand Oaks, CA: Sage.