Codificación de IA

ATLAS.ti se enorgullece de ofrecer la primera de muchas funciones verdaderamente automatizadas, impulsadas por los modelos GPT de OpenAI, líderes a nivel mundial.

La codificación de IA le ayuda a usted, el investigador, "leyendo" sus documentos y realizando una codificación inductiva completamente automatizada. Por supuesto, puede revisar y perfeccionar los códigos generados para adaptarlos a su investigación, pero puede ahorrarle un tiempo valioso al procesar sus datos y realizar la tarea mecánica de la codificación inicial. El tiempo ahorrado puede utilizarse para refinar y fusionar códigos, realizar análisis y producir visualizaciones al presentar su investigación.

Tenga en cuenta que la codificación de IA es una función en versión beta. Puede utilizarla libremente y agradecemos sus comentarios sobre todos sus aspectos.

Puede acceder a la codificación de IA a través del menú Análisis, el botón Documentos en la barra de herramientas principal, o en la sección Análisis de los menús contextuales del documento o del grupo de documentos.

Descripción general rápida

Comience seleccionando los documentos o grupos de documentos que desea que ATLAS.ti codifique. Después de hacer clic en "Iniciar codificación", ATLAS.ti le preguntará si desea continuar y le mostrará una estimación aproximada del tiempo que tardará en procesar sus datos.

La codificación de IA cargará el contenido de su documento en los servidores de ATLAS.ti y OpenAI. Nunca cargaremos sus datos sin su consentimiento explícito. Si desea continuar, active la casilla de verificación donde reconoce que acepta nuestro EULA y nuestra Política de privacidad. OpenAI NO utilizará los datos de los usuarios de ATLAS.ti para entrenar los modelos de OpenAI.

Puede continuar trabajando mientras se ejecuta la codificación de IA.

Una vez finalizada la codificación de IA, ATLAS.ti le presentará un resumen de los resultados. Aquí puede cambiar el número de categorías que desea arrastrando el control deslizante o ingresando un número en la parte inferior izquierda. Esto no cambiará los códigos que obtenga de la codificación de IA, sino que los agrupará de manera diferente. Esto puede ser útil si la agrupación predeterminada es demasiado amplia o demasiado detallada para usted.

Es posible que el algoritmo de agrupación no siempre devuelva el número exacto de clústeres solicitado.

Puede alternar entre una lista y una visualización de gráfico de fuerza dirigida de los clústeres de códigos. Haga clic en un código o categoría para ver las citas que codificarán.

Cuando esté satisfecho, haga clic en "Aplicar" y ATLAS.ti aplicará la codificación y le mostrará un resumen.

Puede cerrar esta ventana ahora; la codificación está lista.

Todos los códigos generados por la codificación de IA formarán parte del grupo de códigos "Códigos de IA".

Resultado de codificación de IA

Cómo aprovechar al máximo la codificación de IA

Es mejor enviar documentos que pertenezcan temáticamente al mismo grupo en la misma ronda de codificación de IA. Esto mejorará la calidad de la codificación y permitirá que ATLAS.ti ignore los patrones repetitivos entre documentos, como las preguntas de entrevistas.

La codificación de IA funciona por párrafos. Para obtener los mejores resultados, las preguntas de entrevistas o los nombres de los participantes en las transcripciones deben estar en su propio párrafo, y la estructura de párrafos de un documento debe estar bien definida. Al editar su documento, utilice los números del margen izquierdo para determinar la separación entre párrafos.

Los documentos PDF no contienen párrafos, aunque lo parezca, por lo que los resultados de los documentos PDF probablemente serán deficientes.

La codificación de IA omite los párrafos muy cortos.

La codificación de IA solo analiza el texto sin formato de sus documentos. Los códigos, citas y formatos existentes no tienen ningún efecto en sus resultados.

Codificación de IA en profundidad

La codificación de IA funciona con la familia de modelos de lenguaje de gran escala GPT. Estos modelos se basan en grandes cantidades de textos diversos y en entrenamiento adicional por parte de investigadores humanos, lo que les permite utilizarse de manera general.

En ATLAS.ti ofrecemos acceso sencillo a estos potentes modelos con nuestra función de codificación de IA, sin necesidad de comprender y gestionar los detalles técnicos y las limitaciones. ATLAS.ti divide automáticamente su texto en fragmentos que son procesados por la IA y los pasa a los modelos GPT para un análisis repetido. Los resultados del análisis se combinan algorítmicamente para ofrecer la mejor combinación de códigos que cubran diferentes temas sin producir una cantidad abrumadora de códigos.

A continuación se presenta una visión detallada de estos pasos:

Los modelos de lenguaje de gran escala son sensibles al texto circundante, ya que tienen una ventana de atención, también llamada contexto. Elegir el contexto adecuado es clave al trabajar con un modelo de lenguaje de gran escala. Un contexto corto puede significar que no se procesa mucha información, porque algunas palabras o incluso oraciones solo tienen sentido en un contexto más amplio. Elegir un contexto demasiado grande satura el modelo con información y dificulta que los algoritmos de extracción de códigos encuentren códigos significativos. ATLAS.ti elige contextos de no menos de 100 caracteres de longitud, pero realiza cortes en los límites naturales de los párrafos. Hemos comprobado que estas restricciones tienen un impacto positivo en la calidad de la codificación, al mismo tiempo que excluyen la mayoría de los encabezados y títulos que son de menor importancia para los investigadores cualitativos. Como paso adicional para reducir el ruido en los datos analizados, ATLAS.ti elimina del análisis los párrafos que aparecen más de una vez, ya que es probable que sean frases recurrentes de entrevistas o nombres de hablantes.

En el primer paso del análisis, se encomienda a los modelos de IA que encuentren codificaciones significativas para cada segmento de datos, actuando como si el modelo fuera un asistente de investigación cualitativa. Como los modelos de la familia GPT son bastante creativos, la codificación de IA puede producir codificaciones similares, mientras que otras abordan el mismo tema pero se expresan de maneras diferentes. Este procedimiento puede producir cientos de códigos distintos que no son manejables de manera eficiente.

Para abordar esto, utilizamos una característica de los modelos de lenguaje llamada embeddings (representaciones vectoriales), donde cada palabra o frase puede asociarse con un punto en un espacio multidimensional. Una de las propiedades útiles de esta característica es que las palabras y frases más similares entre sí se ubican más cerca unas de otras que las palabras o frases menos similares. Aprovechando esta propiedad, ATLAS.ti agrupa los códigos combinando los más cercanos entre sí en una colección. Esta agrupación se repite hasta alcanzar un número satisfactorio de colecciones.

Los códigos combinados se asocian con los segmentos generados y se proponen en la interfaz de ATLAS.ti para la visualización de citas.

Tenga en cuenta que, aunque en general es beneficioso que los modelos GPT hayan sido entrenados con grandes cantidades de texto, en algunas situaciones esto puede dar lugar a resultados incorrectos que no reflejan con precisión a personas, lugares o hechos reales. En algunos casos, los modelos GPT pueden incorporar sesgos sociales como estereotipos o sentimientos negativos hacia ciertos grupos. Debe evaluar la precisión de cualquier resultado según corresponda a su caso de uso.