ANÁLISIS Y PREPARACIÓN DE DATOS
ING. ROMINA DAZA RAMOS
www.marketing-usfx-sucre.simplesite.com
1. PREPARACIÓN DE DATOS
• Proceso de preparación de datos:
1) Revisión del cuestionario
2) Edición
3) Codificación
4) Trascripción
5) Depuración de los datos
6) Ajuste estadístico de los datos
7) Elección de una estrategia de análisis de los datos
1. PREPARACIÓN DE DATOS
1) Revisión del cuestionario:
El paso inicial en la revisión del cuestionario implica verificartodos los cuestionarios en cuanto a la calidad de las entrevistas yque estén terminados.
A menudo estas revisiones se realizan mientras el trabajo decampo sigue en proceso. Si se contrató a una empresa derecolección de datos para realizar el trabajo de campo, elinvestigador debe hacer una revisión independiente luego de queésta ha terminado.
1. PREPARACIÓN DE DATOS
1) Revisión del cuestionario:
Un cuestionario que regresa del campo podría ser inaceptable por variasrazones:
1. Algunas partes del cuestionario están incompletas.
2. El patrón de respuestas indica que el encuestado no entendió o siguió lasinstrucciones. Por ejemplo, cuando no se siguieron los patrones de salto.
3. Las respuestas muestran poca varianza. Por ejemplo, un encuestado sólo marcó laopción número 4 en una serie de escalas de calificación de 7 puntos.
4. Los cuestionarios entregados están físicamente incompletos: faltan una o más páginas.
5. El cuestionario se recibió después de la fecha establecida.
6. El cuestionario fue contestado por alguien que no estaba calificado para participar.
1. PREPARACIÓN DE DATOS
2) Edición:
La edición es la revisión de los cuestionarios con el objetivo deincrementar su exactitud y pre- cisión. Consiste en examinar loscuestionarios para identificar respuestas ilegibles, incompletas,incongruentes o ambiguas.
Las respuestas pueden ser ilegibles si se registraron mal, lo cuales muy frecuente en cuestionarios con un gran número depreguntas no estructuradas. Los datos deben ser legibles paracodificarlos en forma correcta. Asimismo, los cuestionariospueden estar incompletos en diferentes grados. Las preguntas norespondidas pueden ser pocas o muchas.
1. PREPARACIÓN DE DATOS
3) Codificación:
Codificar significa asignar un código, por lo general un número,a cada respuesta posible de cada pregunta.
El código incluye una indicación de la posición en la columna(campo) y el registro que ocupará el dato. Por ejemplo, el sexo delos encuestados se codifica con 1 para las mujeres y 2 para loshombres.
Un campo representa un solo dato, como el sexo de losencuestados. registros para cada encuestado.
1. PREPARACIÓN DE DATOS
3) Codificación:
Un registro consta de campos relacionados, como sexo, estadocivil, edad, tamaño de la casa, ocupación, etcétera.
A menudo, un solo registro contiene todos los datos de unencuestado, aunque también es posible que se utilicen variosregistros para cada encuestado.
1. PREPARACIÓN DE DATOS
3) Codificación:
Si el cuestionario sólo contiene preguntas estructuradas o muypocas preguntas no estructuradas, se realiza una codificaciónprevia.
Esto significa que se asignan códigos antes de realizar el trabajode campo.
Si el cuestionario contiene preguntas no estructuradas, loscódigos se asignan después de que el cuestionario se hayadevuelto del campo (codificación posterior).
1. PREPARACIÓN DE DATOS
4) Transcripción:
La trascripción implica transferir los datos codificados de los
cuestionarios o de las hojas de codificación, a discos o cintas
magnéticas o directamente a la computadora por medio del
teclado.
1. PREPARACIÓN DE DATOS
5) Depuración de los datos:
La depuración de los datos incluye la verificación de lacongruencia y el tratamiento de las respuestas faltantes.
Aunque durante la edición se hizo una comprobaciónpreliminar de la congruencia, en esta etapa las verificacionesson más minuciosas y exhaustivas porque se realizan porcomputadora.
1. PREPARACIÓN DE DATOS
6) Ajuste estadístico de los datos
Los procedimientos para el ajuste estadístico de los datos
son la ponderación, la redefinición de las variables y las
transformaciones de la escala.
Estos ajustes no siempre son necesarios pero pueden
mejorar la calidad del análisis de los datos.
1. PREPARACIÓN DE DATOS
7) Elección de una estrategia de análisis de los datos:
La elección debe basarse en las primeras etapas del procesode investigación de mercados, las características conocidasde los datos, las propiedades de las técnicas estadísticas, y laexperiencia y filosofía del investigador.
El análisis de los datos no es un fin en sí mismo. Supropósito consiste en producir información que ayude aabordar el problema en cuestión.
1. PREPARACIÓN DE DATOS
7) Elección de una estrategia de análisis de los datos:
La elección de la estrategia de análisis de datos debe iniciar
con una consideración de los primeros pasos del proceso de
investigación de mercados.
2. Programas estadísticos para el análisis de datos
• Para convertir los datos e información en conocimiento es necesario
programas computarizados o software poderosos y amistosos con los
usuarios, que pueden ser de mucha ayuda como el EXCEL, SAS y
especialmente el paquete SPSS.
• Para que estos datos sean útiles para la toma de decisiones, hay que
organizar, clasificar y analizar los datos y darlos a conocer a los
responsables de la toma de decisiones.
Tipos de análisis de datos empleados en investigación de mercados
1) Tablas de distribución de frecuencias
2) Medidas de tendencia central y de dispersión
3) Datos de muestra, distribución t.
4) Análisis de varianza
5) Análisis multivariante
Distribución de frecuencias
“Una distribución de frecuencias es un resumen tabular de un conjunto
de datos que muestran la frecuencia (o la cantidad) de artículos en cada
una de varias clases que no se traslapan” (Anderson, 1999:25)
En la construcción de una tabla de frecuencias se deben considerar 3
aspectos: la selección del número de clases, la definición de intervalo de
clase y los límites de cada clase a fin de evitar traslapes.
Distribución de frecuencias
• Selección de clases: El número de clases o categorías paravariables cuantitativas depende de la cantidad de datos,cuanto mayor el número de observaciones, mayor el númerode clases.
• Si existen pocas clases, la información que se obtiene esreducida y si hay muchas se tendrá una baja concentraciónde datos no permitiendo una buena descripción de éstos.
Distribución de frecuencias
• Intervalo de clase: Es el tamaño o anchura de cada clase,sólo se aplica a variables cuantitativas, para su cálculo, uncamino es que todas las clases tengan el mismo tamaño, eneste caso se busca a diferencia entre el dato mayor y elmenor (denominado rango) y se divide entre el número declases que se desean.
• Tamaño de clase = rango/número de clases
Distribución de frecuencias
• Límite de clase: Son las acotaciones para cada intervalo declase que permiten agrupar los datos sin que estos sesobrelapen, es decir, que sólo pertenezcan a una clase.
• Existen intervalos cerrados, que son los que tienen un límiteinferior y superior, y abiertos, en los que se acota el límitesuperior o inferior.
Distribución de frecuencias
• Marca de clase: Es el punto o el valor que se encuentra en lamitad de los límites de cada clase y es representativo de losdatos de esta clase.
• Se calcula de la siguiente manera:
Marca de clase = (límite superior + límite inferior)/2
Medidas de tendencia Central
Media:
La media, o valor promedio, es la medida de tendenciacentral más utilizada.
Sirve para estimar el promedio cuando los datos serecolectaron utilizando una escala de intervalo o de razón.
Los datos deberían mostrar cierta tendencia central, ya quela mayoría de las respuestas se distribuyen alrededor de lamedia.
Medidas de tendencia Central
Moda:
La moda es el valor que ocurre con mayor frecuencia y
representa el pico más alto de la distribución.
La moda es una buena medida de localización cuando la
variable es categórica o se ha agrupado en categorías.
Medidas de tendencia Central
Mediana:
La mediana de una muestra es el valor intermedio cuando los datos
están acomodados en orden ascendente o descendente. Cuando el
número de datos es par, la mediana se calcula como el punto medio
entre los dos valores intermedios: al sumar los dos valores
intermedios y dividir la suma entre 2. La mediana es el percentil 50, y
es una medida de tendencia central adecuada para datos ordinales.
3. Medidas de variación
Las medidas de variación, que se calculan con datos de
intervalo o de razón, incluyen el rango, el rango
intercuartílico, la varianza o la desviación estándar y el
coeficiente de variación.
3. Medidas de variación
Rango:
El rango mide la dispersión de los datos, y se define
simplemente como la diferencia entre el valor más grande y
el valor más pequeño en la muestra. Debido a esto, el rango
se ve directamente afectado por los valores extremos.
Rango = X más grande - X más pequeña
4. Determinación de la demanda
Df= D0(1+i)^n
Df = Demanda final
D0 = Demanda inicial
i = Tasa de crecimiento
4. Determinación de la demanda
Df= D0(1+i)^n
AÑO Demanda (Kg)
2015 Demanda inicial 278
2016 Df = 278(1+0.08)^1 300.24
2017 Df = 278(1+0.08)^2 324.25
2018 Df = 278(1+0.08)^3 350.19
2019 Df = 278(1+0.08)^4 378.21
2020 Df = 278(1+0.08)^5 408.47
Ejemplo Demanda de queso para el ITA
4. Determinación de la demanda
Df= D0(1+i)^nEjemplo Demanda de
queso para el ITA
0
100
200
300
400
500
2014 2015 2016 2017 2018 2019 2020 2021
Dda (Kg)
Dda (Kg)