HERRAMIENTAS DE ANÁLISIS DE DATOS

Batista EmilioOrtega David

Quiroz RobertoRamea JoséRosas Laura

1

INVESTIGACIÓN CIENTÍFICA (I.C.)Proceso reflexivo, sistemático, crítico que utiliza diversos métodos para el logro de su objetivo, el cual es ir en búsqueda de la verdad o conocimiento.

Concebir la idea o tema a investigar Plantear el problema de investigación. Elaborar el marco teórico Definir el tipo de investigación Establecer hipótesis Seleccionar el diseño apropiado de

investigación Selección de la muestra Recolección de datos Analizar datos Presentar los resultados

ETAPAS DEL PROCESO DE INVESTIGACIÓN

2

ESTADISTICA DESCRIPTIVA PIBAnálisis descriptivo: consiste en resumir los datos disponibles para extraer la información relevante en el estudio.

3

Datos para calcular rango, mínimo y máximo

4

Clase Frecuencia%

acumulado Clase Frecuencia % acumulado90.5 1 0.74% 4276.125 78 57.35%

4276.125 78 58.09% 8461.75 25 75.74%8461.75 25 76.47% 12647.375 14 86.03%

12647.375 14 86.76% 16833 7 91.18%16833 7 91.91% 25204.25 4 94.12%

21018.625 3 94.12% 21018.625 3 96.32%25204.25 4 97.06% 29389.875 2 97.79%

29389.875 2 98.53%y mayor... 2 99.26%y mayor... 2 100.00% 90.5 1 100.00%

0,00%

20,00%

40,00%

60,00%

80,00%

100,00%

120,00%

0102030405060708090

Frec

uenc

ia

Clase

Histograma

Frecuencia

% acumulado

5

CORRELACIÓNCORRELACIÓNPIB Importaciones

PIB 1

Importaciones 0.98787598 1

El PIB : la intercepción es de 587.6 en el eje y, y la pendiente es de 1.368 .Es el grado de asociación 0.987

PIB: expresa el valor monetario de la producción de bienes y servicios de demanda final de un país

y = 1,368x + 587,6R² = 0,975

0,0

5000,0

10000,0

15000,0

20000,0

25000,0

30000,0

35000,0

40000,0

0,0 5000,0 10000,0 15000,0 20000,0 25000,0

Títu

lo d

el e

je

Título del eje

PIB vs importaciones Panamá

PIB

Lineal (PIB)

6

REGRESIÓNREGRESIÓNEstadísticas de la regresión

Coeficiente de correlación múltiple 0.987875979Coeficiente de determinación R^2 0.97589895R^2 ajustado 0.975533782Error típico 1254.0976Observaciones 68

ANÁLISIS DE VARIANZAGrados de

libertadSuma de

cuadrados F Valor crítico de FRegresión 1 4203155863 2672.469892 4.00728E-55Residuos 66 103802212.2Total 67 4306958075

Coeficientes Error típico Probabilidad Inferior 95% Superior 95%Inferior 95.0% Superior 95.0%

Intercepción 587.6102931 192.4878 0.003266803 203.2960048 971.9245813203.29600

48 971.9245813

Importaciones 1.368089822 0.026464165 4.00728E-55 1.315252412 1.4209272321.3152524

12 1.420927232

7

K=3Base de datos de 1946 a 1970

#N/A

#N/A

291.066667

303.366667

302.333333

306.366667

317.666667

336.033333

353.733333

370.133333

386.366667

412.966667

433.133333

455.966667

472.9

505.4

546.166667

600.366667

654.233333

715.2

777.866667

856.4

935.566667

1024.53333

1120.83333

0200400600800

100012001400

1 3 5 7 9 11 13 15 17 19 21 23 25

Valo

r

Punto de datos

Real

Pronóstico

0

100

200

300

400

500

1 3 5 7 9 11 13 15 17 19 21 23 25

Valo

r

Punto de datos

Real

Pronóstico

#N/A

#N/A

101.533333

103.9

95.7666667

94.5

96.8333333

101.133333

106.3

112.866667

124.733333

132.2

137.866667

142.633333

155

162.6

174.9

192.033333

212.533333

233.566667

255

282.533333

305.4

334.5

373.333333

8

0

5000

10000

15000

20000

25000

30000

35000

1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55 57 59 61 63 65 67

Valo

r

Punto de datos

PIB 1946 2013 20% Panama Suavización exponencial

Pronóstico

Base de datos de 1946 a 1970

Model Summaryb

Model R R Square

Adjusted R

Square

Std. Error of

the Estimate

Change Statistics

Durbin-Watson

R Square

Change F Change df1 df2 Sig. F Change

1 .988a .976 .976 1254.0976 .976 2672.470 1 66 .000 1.399

a. Predictors: (Constant), Importaciones

b. Dependent Variable: PIB

SPSS IBM

PROGRAMACION LINEAL CON SOLVERPlanteamiento problema:Se esta planeando la mezcla de cultivos de Maíz, Avena y Trigo, en una granjapara la próxima temporada. En una tabla se muestra la mano de obra y fertilizantesrequeridos por acre. La familia quiere saber que combinación de cultivos deben serplantados para maximizar las utilidades de la familia.Comandos solver. Sumaproducto(matriz1,matriz2), función objetivo, y asignación de recursos

9

Prueba de KMO y BartlettMedida Kaiser-Meyer-Olkin de adecuación de muestreo .920

Prueba de esfericidad de Bartlett

Aprox. Chi-cuadrado 3696.041

gl 136Sig. .000

Es una técnica estadística de reducción de datos usada para explicar las correlaciones entre las variables observadas en términos de un número menor de variables no observadas llamadas factores

Varianza total explicada

Componente

Autovalores inicialesSumas de extracción de

cargas al cuadradoSumas de rotación de cargas al

cuadrado

Total

% de varianza

% acumulado Total

% de varianza

% acumulad

o Total% de

varianza%

acumulado1 8.9

31 52.533 52.533 8.931 52.533 52.533 5.025 29.557 29.557

2 1.542 9.073 61.606 1.542 9.073 61.606 3.890 22.881 52.438

3 1.197 7.040 68.646 1.197 7.040 68.646 2.755 16.208 68.646

Método de extracción: análisis de componentes principales.

La medida de adecuación muestral KMO (Kaiser-Meyer-Olkin) contrasta si las correlaciones parciales entre las variables son suficientemente pequeñas. Permite comparar la magnitud de los coeficientes de correlaciónobservados con la magnitud de los coeficientes de correlación parcial Sig menor que .05

10

Matriz de componente rotadoa

Componente1 2 3

P41CRI Contribución del dep.satisfacciónclientes .804 .219 .112

P40CRI Estímulo intercambios de informacion .795 .222

P39CRI Reuniones interfuncionales .774 .258 .144P38CRI Individuo al servicio del mercado .749 .259 .119P37CRI Estrategias concertadas .736 .335 .238P36CRI Difusión de información interdepartamental .683 .235 .209

P04ACL Nuevos segmentos mercado .580 .377 .382P05ACL Problemas clientes con productos .492 .338 .359P21ACO Objetivos y estrategias competencia .181 .827 .264P23ACO Políticas mercadotecnia competencia .394 .811 .153

P22ACO Puntos fuertes y débiles competencia .356 .802 .178

P24ACO Amenazas productos sustitutos .474 .701 .167P25ACO Carac. imagen prods.competencia .206 .645 .217P01ACL Medición grado satisfaccion .863P03ACL Factores decision compra .123 .286 .798P02ACL Evaluacion necesidades mercado .446 .261 .712P06 ACL Evolución imagen productos .447 .430 .486

En síntesis consiste en hacer girar los ejes de coordenadas, que representan a los factores, hasta conseguir que se aproxime al máximo a las variables en que están saturados. la saturación de factores transforma la matriz factorial inicial en otra denominada matriz factorial rotada. La matriz factorial rotada es una combinación lineal de la primera y explica la misma cantidad de varianza inicial

Nombre de los factoresAnalizando con qué variables tiene una relación fuerte es posible, en muchos casos, tener una idea más o menos clara de cuál es el significado de un factor.

11

La tabla muestra un resumen de los casos procesados: el número y porcentaje decasos válidos analizados, el número y porcentaje de casos con valores perdidos enalguna de las variables incluidas en el análisis, y el tamaño total de la muestra, queno es otra cosa que la suma de los casos válidos y los perdidos.

Matriz de proximidades

La tabla muestra la matriz de distancias para los 7 primeros casos de un ejemplo.La tabla indica, en la cabecera de las columnas, que la medida utilizada es ladistancia euclídea al cuadrado y, a pie de tabla, que se trata de una matriz dedisimilaridades.

12

13

USO IBM SPSS PARA LA GRAFICA DE SEDIMENTACION

En un dendrograma, además de estar representadas las etapas del proceso de fusión, también lo están las distancias existentes entre los elementos fundidos. Pero las distancias no están representadas en su escala original sino en una escala estandarizada de 25 puntos. Las líneas verticales identifican elementos fundidos (conglomerados); y la posición de las líneas verticales indica la distancia existente entre los elementos fundidos.

Muchas Gracias14

Technology

HERRAMIENTAS DE ANÁLISIS DE DATOS