Es una técnica aparecida con el objetivo de mejorar los resultados de segmentación obtenidos mediante AID. CHAID requiere una variable dependiente categórica y varias variables independientes o predictivas que, combinadas, permiten identificar segmentos. Está limitado a variables nominales y ordinales y no hace suposición de normalidad.
El análisis CHAID “Chi-Square Automatic Interaction Detector” (Detector de Interacción Automática con Chi-Cuadrado) es una herramienta utilizada como técnica de segmentación de mercado para descubrir la relación entre las variables de respuesta categóricas, así como qué características definen a determinados grupos y perfilar qué variables específicas tienen un mayor impacto en la diferenciación de los grupos; Como por ejemplo, sexo, nivel socioeconómico, religión, ocupación, raza, ciudad, municipio, zona, etc.; en la que existe una variable dependiente y al menos una variable independiente, de lo que se trata es de predecir la variable dependiente a través de las variables independientes.
EL CHAID le puede ahorrar mucho tiempo al investigador, evitando que éste analice cientos de tablas, sin encontrar alguna relación importante entre las variables. El AN´ÁLISIS CHAID identificará rápida y fácilmente las relaciones significativas entre las variables. Le permite al usuario reconocer segmentos del mercado, explicar las diferencias en estudios de satisfacción del cliente, conocer el perfil de los que gustaron de un nuevo concepto, producto, empaque o publicidad.
El análisis está basado en la prueba de Chi-cuadrado, por medio de la que se pueden encontrar patrones en datos que tienen muchas variables categóricas, crea segmentos y luego presenta los datos en una representación visual. Conociendo algunas características de los clientes, el análisis CHAID puede construir un árbol que divide el conjunto de datos a lo largo de la variable elegida, y muestra el efecto de las características sobre la probabilidad de respuesta a la estrategia.
5 principales características del análisis CHAID
- Modelo predictivo: El análisis CHAID construye un modelo de análisis predictivo, o de árbol, para ayudar a determinar cómo se combinan mejor las variables para explicar el resultado en la variable dependiente.
- Datos nominales, ordinales y continuos: En este análisis se pueden utilizar datos nominales, datos ordinales y continuos, en los que los predictores continuos se dividen en categorías con aproximadamente el mismo número de observaciones.
- Tabulaciones cruzadas: El análisis crea todas las tabulaciones cruzadas posibles para cada predictor categórico hasta que se consigue el mejor resultado y no se puede realizar ninguna otra división.
- Árbol de decisión: En el análisis CHAID podemos ver visualmente las relaciones entre las variables divididas y el factor relacionado asociado dentro del árbol.
- Nodos: El análisis divide el objetivo en dos o más categorías que se denominan nodos iniciales, o padres, y luego los nodos se dividen mediante algoritmos estadísticos en nodos hijos.
¿Cómo realizar un análisis CHAID?
El análisis CHAID puede realizarse utilizando una variedad de entradas que incluyen escalas (por ejemplo, calificación de satisfacción de 1 a 5) así como preguntas categóricas (por ejemplo, datos demográficos).
Este análisis solo puede realizarse si las variables producen una división estadísticamente significativa en la muestra de investigación. La primera categoría de predictores que utiliza el análisis CHAID para dividir la muestra es el predictor que más se asocia con la variable de respuesta, es decir, da los grupos de encuestados más diferenciados.
El árbol de decisión se sigue construyendo, dividiendo la base de clientes hasta que el algoritmo ya no encuentra ningún predictor significativamente discriminante. Este análisis tiene la ventaja de proporcionar detalles sobre los niveles generales en cada etapa del árbol de decisión.
Pero entonces ¿cómo se compone este árbol de decisión?
los componentes son los siguientes:
- Nodo raíz: Representa la variable dependiente o de destino.
- Nodos padres: Son las categorías derivadas de la variable objetivo por parte del algoritmo.
- Nodos hijos: Son las categorías que se encuentran por debajo de las categorías de los nodos padres.
- Nodo terminal: Es la categoría que presentó una menor influencia en la variable dependiente.
Ahora que ya conoces en qué consiste el análisis CHAID y cómo puedes llevarlo a cabo, ¿te gustaría conocer otras metodologías y técnicas para desarrollar tu investigación de forma más práctica y precisa? Déjanos ayudarte en QUALYLIFE somos expertos en investigación y pondremos en práctica las mejores herramientas para realizar tus investigaciones y entregar el análisis más detallado posible para tus necesidades Contáctanos: www.qualylife.com.co
Escrito por: Jennifer Suárez
Encuentra información de interés y practica en:
https://co.pinterest.com/Qualylife
https://www.instagram.com/qualylifecolombia/
https://www.facebook.com/Qualylifecolombia
https://www.linkedin.com/company/qualylife/
https://twitter.com/QualylifeCol
https://www.youtube.com/channel/UCRX7oBnuiLUmCGtQ6tcnDfQ