41
OBJETIVOS DE LA UNIDAD:

Entre Gau No Compendi o

Embed Size (px)

DESCRIPTION

primera guia

Citation preview

OBJETIVOS DE LA UNIDAD:

1. Identificar las principales herramientas de trabajo en la estadstica.2. Demostrar la importancia del R en el manejo de toda la formulacin y prctica de la estadstica.3. Utilizar el R en el desarrollo de guas de trabajo y aplicabilidad en problemas especficos de la estadstica.

ORIGEN

La estadstica es una ciencia que surge de la teora de las probabilidades nace de un juego de azar, en las cartas, en los dados en la probabilidad de perder o ganar esta el origen de la estadstica.

DEFINICIONLa estadstica, es la ciencia dedicada a la coleccin, anlisis, interpretacin y representacin de las conclusiones extradas de datos numricos y muchas veces cualitativas.

Por ejemplo: para estudiar el grado de desercin de un colegio se toman datos de varios aos y que reposan en los archivos del colegio mientras la informacin necesaria no este recolectada el estudio y el anlisis estadstico no comienza, la informacin no puede ser parcial.

CAMPO DE ACCIONLa aplicacin de la estadstica en la direccin de procesos enfatiza en la toma de decisiones. La necesidad de resolver problemas pone de manifiesto la aplicabilidad de la estadstica. La aplicabilidad se extiende a todo el universo social, biolgico, fsico, ingenierl, educacional, mdico, de negocios y leyes, en fin a casi todas las fases de la vida.

El campo de la estadstica es una disciplina dirigida a lograr un mejor entendimiento del mundo que nos rodea, con el objetivo final que todos tengamos una vida ms completa y con un mayor entendimiento de la misma. No hay parte de nuestro ambiente que no sea una fuente de datos (nosotros mismos, otros individuos, la familia, sociedades, culturas, ciudades, pases, planetas, escuelas, colegios religiones, etc), en pocas palabras cada aspecto de nuestra existencia.

Por ejemplo en un colegio podemos obtener los siguientes datos que en el caso especfico de abordar un problema seran necesarios y la necesidad de resolver este problema hace que nosotros busquemos la fuente:Proceso de gratuidad, estratos sociales, edades, rendimientos acadmicos basados en logros, deserciones, problemas de drogadiccin, resultado de las pruebas saber, entre otros.

En la universidad los procesos investigativos, la tabulacin de resultados de procesos, los rendimientos acadmicos. La utilidad de la estadstica no mira el tipo de datos que referencie una investigacin, por ejemplo, desde la estadstica se han dado solucin a proyectos relacionados con: Evaluacin docente, implementacin de competencias en el aula de clase, identificacin de perfiles docentes investigativos.

DIVISINLa estadstica se divide en dos grandes ramas de estudio que: Se encarga de la recoleccin, clasificacin y descripcin de datos mustrales o poblacionales, para su interpretacin y anlisis

Estadstica descriptiva:Desarrolla modelos tericos que se ajusten a una determinada realidad con cierto grado de confianza.

Estadstica inferencial:

ESTUDIOS ESTADISTICOSUn estudio estadstico es una de las aplicaciones mas importantes para cualquier profesional llmese, ingeniero, profesor, medico, contador, administrador, etc. En los diferentes informes resultados de las investigaciones requieren de la estadstica ya sea en la descripcin de los datos, o en la demostracin de inferencias propuestas.Todo estudio estadstico parte de la observacin de un fenmeno. La observacin implica un proceso de anlisis, de interpretacin del medio o del contexto en donde vive inmerso el problema a solucionar. La observacin es una vivencia un acto de compartir experiencia entre el investigador y el investigado. Toda observacin se registra sobre una carpeta de datos. La observacin nos permite conocer la poblacin, sus caractersticas, su forma de vida, sus problemas y priorizar sus necesidades. De la Observacin se puede partir a Plantear un problema que priorice las necesidades de un comunidad. Conocido el problema y como producto de la buena observacin se procede a formular objetivos, e hiptesis. De la observacin tambin podemos determinar el tamao de la poblacin y la muestra, un margen de error del que partimos a recolectar datos de la muestra. Los datos se levantan utilizando diferentes instrumentos entre los que podemos destacar: Encuestas, entrevistas, Chat, correos electrnicos, paginas Web, etc. Despus de la recoleccin de los datos se procede a clasificar y ordenar dichos datos, para entrar por ultimo a la etapa de la tabulacin, de la presentacin y anlisis de la informacin. La publicacin del resultado final se hace siguiendo las pautas de las normas ICONTEC.

UTILIZACION DEL R EN LA ESTADSTICAR- es un software de libre distribucin, apropiado para el anlisis de datos cuantitativos o cualitativos. El poder de esta aplicacin no solo radica en la forma precisa como entrega los resultados si no como los grfica. R es un aplicativo de amplia difusin y por tanto ofrece una infinidad de ayudas en lnea, incluyendo la ayuda que pueden ofrecer comunidades virtuales dedicadas al enriquecimiento de esta herramienta.

INSTALACION DE R1. Entrar en la pgina web: http://www.r-project.org/ , La pgina tiene el siguiente aspecto (Ver figura 1)2. Pulsar el conector CRAN bajo la referencia Download. Aparecen un conjunto de direcciones web en el mundo (mirrors, espejos) donde est disponibles copias del software para ser descargadas.

Figura 1: Aspecto de la pgina proyecto R

Por proximidad se puede elegir la de Espaa, asociada al CSIC: http://cran.es.r-project.org/ (Ver figura 2)

Figura 2: conjunto de direcciones web en el mundo para descarga de R en espaol3. En el recuadro Download and Install R, seleccionar Windows, si es el caso, para descargar una versin precompilada binaria del sistema R. Resulta una pgina con el ttulo R for Windows (Ver figura 3)

Figura 3: Recuadro Dowloand de instalacin de R

En la ventana anterior pulsar base, para descargar el paquete bsico. Resulta una pgina con el ttulo R-2-13-2 for Windows. En ella, elegir el hipervnculo R-2.13.2-win32.exe, con lo que nos saldr la ventana de dilogo. (Figura 4)

Figura 4: Escogiendo la opcin para windows R 2.13.2

Elegimos Guardar, es el programa ejecutable (.exe) instalador del sistema R bsico. Lo descargamos en la carpeta que nos convenga, por ejemplo en el Escritorio. Lo ejecutamos con doble clic, y en la ventana de dilogo que resulta elegimos ejecutar, teniendo en cuenta:

Figura 5: Ventana ejecutar

Elegimos Guardar, es el programa ejecutable (.exe) instalador del sistema R bsico. Lo descargamos en la carpeta usual, o en el Escritorio. Lo ejecutamos con doble clic, y en la ventana de dilogo que resulta elegimos Ejecutar, teniendo en cuenta:a. Cuando pregunta si deseamos establecer opciones de instalacin, escogemos S, se elige la opcin de espaol, (figura 6)

Figura 6: Eleccin del Idioma

b. En la aprobacin de las opciones de R se elige en la siguiente ventana Instalacin completa

Figura 7: Instalacin completa

Para el modo de presentacin (MDI o SDI), escoger SDI. Continu con la instalacin aceptando las opciones que le ofrece el programa en esta etapa

INICIANDO REjecute el programa R, una vez instalado. Lo haremos pulsando un icono que es una letra R grande que al instalar nos habr generado en nuestro escritorio. Tambin eligiendo el programa por la va >>Inicio>Programas>R> R 2.13.2

Figura 8: Instalacin de paquetes

Al ejecutar R aparece la ventana bsica R Consol. En el men Paquetes, oprimir en Seleccionar espejo CRAN. En el cuadro de dilogo, escoger Spain (Madrid), France (Toulouse), Portugal o algn otro cercano, y pulsa OK.

En el men Paquetes, oprimir en Instalar paquete(s). As se va a completar la instalacin instalando paquetes de programas adicionales al paquete base. Este proceso de Instalar paquetes se hace slo la primera vez. (Ver Grfico 8)

Escoger fBasics y Rcmdr y aceptar. Si nos dice que le hace falta instalar otros paquetes que complementan a los anteriores, aceptar la propuesta. Con estas opciones al ingresar nuevamente al contexto de R, aparecer la ventana de R-Comander.

R- COMO HERRAMIENTA MATEMTICA

El poder de R est en el procesamiento de la informacin para el proceso estadstico de la misma, sin embargo es posible darle un buen uso para mucho de los procesos matemticos que incluyen otros paquetes como Matlab, de tal manera que se puede darle tratamiento a R como una calculadora, como un paquete para la solucin de matrices, o para hacer grficos de funciones reales. Cabe resaltar que el software estadstico R es de uso libre en el dominio pblico, y resulta del esfuerzo cooperativo de personas e instituciones acadmicas relevantes relacionadas con la Estadstica y la Computacin en todo el mundo.

Para tal efecto R incluye una serie de comandos que representan las operaciones matemticas. Ver tabla 1

AritmticosComparativosLgicos

+ Suma== igualdad& Y lgico

- Resta!= Diferente de ! No lgico

* Multiplicacin< Menor que| O lgico

/ Divisin> Mayor que

^ Potencia= Mayor o igual

Tabla 1: Operadores aritmticos en R

De la misma manera R establece una serie de comandos para el manejo de las funciones matemticas. Se agrega en la tabla elementos que corresponden a comandos propios de la estadstica como la varianza, la media, entre otros. Ver tabla 2.

OperacionesDescriptivos

Raz cuadrada de x sqrt(x)Media mean(x)

Exponencial de x exp(x)Desv. Tpica sd(x)

Logaritmo neperiano log(x)Varianza var(x)

N de elementos de un vector x length(x)Mediana median(x)

Suma los elementos del vector x sum(x)Quantiles quantile(x,p)

Seno de x sin(x)Mximo y Mnimo range(x)

Coseno de x cos(x)Ordenacin sort(x)

Tangente de x tan(x)Resumen de todossummary

Tabla 2: Comandos de R para el manejo de funciones y medidas estadsticasEjemplos1.ProblemaSolucin en R

; Donde B4= 8; B5=10; B6=-3 > B4=8> B5=10> B6=-3> (B4+B5)/B6[1] -6

2. ProblemaSolucin en R

Donde B2 = 10 B3= 2; B4 = 6> B2=10> B3=2> B4=6> (((B3+B2)^5)/(log(B2+B4)))^1/5[1] 17949.43

EJERCICIOS PARA PRACTICAR EN R

1. Se tiene una poblacin de 1500 estudiantes en un colegio. Se plantea el problema de desnutricin en los primeros grados (De primero a Quinto) en donde existes 500 estudiantes. La poblacin vulnerada es fcil de entrevistar y los padres estn en disposicin de brindar mucha informacin. Calcule en R el tamao de la muestra sobre la que se har el estudio sabiendo que el margen de error es del 1% mediante la frmula: 2. desarrollar el polinomio A1=5, A2=-2,A3=5, A4=8, A5=7

OBJETIVOS DE LA UNIDAD:1. Establecer diferencias entre los principales conceptos utilizados en la estadstica.2. Determinar la importancia del R en el manejo de las funciones matemticas.

TERMINOLOGIAPOBLACIN: Se define como un conjunto de individuos o de objetos que poseen una o varias caractersticas comunes. El total de las unidades posibles de observar hace referencia tambin a una definicin de poblacin.

La poblacin no hace referencia nicamente a los seres vivos; una poblacin puede estar constituida por los peces de un estanque, por animales de una determinada raza, as como por los establecimientos educativos de una ciudad o de un ncleo educativo.

POBLACIONES FINITAS:

En este tipo de poblacin el nmero de unidades observables es contable, es decir un nmero conocido de elementos del conjunto llamado poblacin:

Por ejemplo:a. Alumnos Matriculados en el ao 2005 en un colegio de la capital.b. Cantidad de estudiantes que proceden de provincias a un colegio de la capital

POBLACIONES INFINITAS:

En este tipo de poblacin el conteo de unidades observables se hace un poco difcil. El trmino de infinito en estadstica no se ajusta a una definicin semntica.

Por ejemplo:a. La cantidad de ensayos que hace un estudiante en un experimento de laboratorio repetido indefinidamente.

b. Nmero de hijos de todas las familias que conforman la gran comunidad educativa en un colegio.

MUESTRA:Se define como la mejor representacin de la poblacin. La muestra es un subconjunto de la poblacin a la cual se le efecta la medicin con el fin de estudiar las propiedades del conjunto del cual es obtenida. El tamao de la poblacin, la disponibilidad de recursos, la homogeneidad de los elementos y de los datos que la conforman le da la importancia suficiente al uso adecuado de la muestra. Un buen conocimiento de la poblacin permite encontrar una buena muestra representativa. Existen muestras tomadas al azar y sin seguir ningn modelo de muestreo que llevan a conclusiones inadecuadas y por tanto a tomas de decisiones que no corresponden a la solucin de un problema planteado al interior de conjunto.PARMETROS:

Son medidas utilizadas para realizar descripciones cuantitativas de los conjuntos de datos, o poblaciones suelen estar representadas con letras griegas (por ejemplo y .

ESTADSTICOSSon medidas que describen cuantitativamente a una muestra son representados por letras de nuestro alfabeto (por ejemplo, x o y).

VARIABLE: Es el conjunto de caractersticas de las entidades que interesan en una investigacin. Como por ejemplo, Tamao, edad, precios, rendimiento acadmico, Indicadores econmicos.

VARIABLES ENTERAS O DISCRETA:Los elementos que se visualizan estn representados por nmeros enteros:

Ejemplo:Nmero de estudiantes en la universidad.Nmero de computadores encendidos, en una sala de sistemas.Nmero de crditos acadmicos escogidos por un estudiante en un semestre determinado.

VARIABLES REALES O CONTINUAS: Es aquella que tericamente puede tomar cualquier valor dentro de un intervalo de valores, ella se mide uniformemente. Dentro de la escala de los conjuntos numricos representan a los nmeros Reales.Ejemplo:Estatura de los estudiantes de dcimo grado de un colegio.Salarios devengados por los docentes de un ncleo educativo.Temperaturas a ciertas horas del da. Edad exacta de una persona.

VARIABLES CUALITATIVAS:Representan caractersticas propias de las cualidades de los objetos que conforman la muestra o la poblacin.Ejemplo: Sexo Origen Color de pielLas variables cualitativas se dejan expresar en niveles de categoraEjemplo: Sexo: masculino- Femenino Origen: Colombiano Venezolano Panameo Color de piel: Blanco Negro Amarillo.

VARIABLES DEPENDIENTES E INDEPENDIENTES: Una variables se hace independiente cuando puede tomar en forma particular cualquier valor, la variable se hace dependiente cuando esta sujeta a los valores que tome la variable independiente.

Para poder hablar de dependencia se hace necesario tener dos variables correlacionadas entre si.

Ejemplo:En la pareja de variables representadas por la edad y peso de los alumnos de un colegio con respecto a la variable independiente y dependiente podemos decir que:

Sea X Edad: Variable Independiente: Significa que podemos tomar estudiantes de cualquier edad

Sea Y Pesos:Las estaturas van a estar sujetas a la edad de los estudiantes.

La relacin en el ejemplo puede ser inversa; es decir que el peso sea independiente para que los valores de la edad dependan del peso que tengan los alumnos. En todo estado de relacin debemos elegir cual es la variable independiente la otra queda sujeta a esta eleccin.

COMO DECLARAR VARIABLES EN R-ESTADISTICO

Las variables en estadstica son representaciones simblicas que asumen diferentes valores. Para definirlas en R se presentan las siguientes caractersticasLa variable puedeEscritura en R

Comenzar con letras

> Estatura=150> Estatura[1] 150

Llevar nmeros> Ingresos2005=150000> Ingresos2005[1] 150000

Separar los valores y letras por medio de puntos> Estatura.nio.1=140> Estatura.nio.1[1] 140

Empezar con puntos.> .Edad=15> .Edad[1] 15

Cuando se le pide a R ejecutar la accin la variable debe ser escrita tal como se la declaro, por ejemplo la variable Ingresos2005 comienza con mayscula si la digita todas en minsculas el programa emite un mensaje de error.> ingresos2005Error: objeto 'ingresos2005' no encontrado

RECORDANDO LAS VARIABLES EN RExisten momentos en que olvidamos las variables que se han declarado, para tal caso se digita sobre la consola de R el comando ls( ).> ls()[1] "estatura" "Estatura" "Estatura.nio.1" "Ingresos2005" [5] "nombre"

Tambin existe el comando history( ), que permite ver las variables y las operaciones que se han realizado con ellas en ventana flotante (ver grfico 11)

Figura 7: ventana flotante del comando history( )

Pidiendo Ayuda:

R posee en idioma ingles una amplia ayuda en lnea que permite guiarse en el camino de las diferentes operaciones que se estn realizando, para ello se digita sobre la consola el comando?, seguido de la expresin que se requiere ayuda. Por ejemplo pidamos ayuda del comando solve

?solvestarting httpd help server ... done

Inmediatamente enva a la pgina en donde aparece todo lo relacionado con el comando solve. El entorno R tambin ofrece ayuda al usuario mediante el men Ayuda en la barra de la ventana R Consola o en otras ventanas especficas

GRAFICANDO FUNCIONES REALES EN R:El grafico matemtico es una de los problemas que con mayor facilidad resuelve el R-Estadstico. En R se pueden graficar, Funciones Lineales, funciones cuadrticas, funciones polinmicas en general, funciones exponenciales, etc.

Como ejemplo empecemos graficando la funcin cuadrtica

Comandos en RResultado Grafico

curve(x^2-5*x+16, -5, 10)

Bajo el mismo comando Curve, se pueden realizar curvas ms complejas que en otro paquete se realizaran con dificultad, por ejemplo el grafico de la tangente.Comandos en RResultado Grafico

curve(tan, -2*pi, 2*pi)

EJERCICIOS PARA PRACTICAR EN R1. Realice el grafico de las siguientes funciones:

a.

b.

c.

FRECUENCIAS:1. Determinar la importancia del uso de las frecuencias en el manejo de las medidas y parmetros de la estadstica.2. Establecer diferencias entre los diferentes tipos de frecuencias y su uso especfico.

3. Hacer uso del R para la construccin de tablas de frecuencias

Para comprender el concepto de frecuencia partimos de una situacin real que a diario sucede en las aulas de clase con un grupo de estudiantes de educacin primaria.

Un Profesor de geografa tienen registrado en su informe de logros la informacin de 20 estudiantes con los siguientes resultados.

ESASDIASEDAISEDASADI

Los datos de los logros obtenidos se pueden registrar en la siguiente tabla.

LogrosNo de estudiantes

DIASE43553

La tabla muestra en forma organizada los resultados de los logros y la cantidad de estudiantes que alcanzaron una determinada valoracin. Al respecto podemos decir:

4 estudiantes obtuvieron D en geografa3 estudiantes obtuvieron I en geografa5 estudiantes obtuvieron A en geografa5 estudiantes obtuvieron S en geografa3 estudiantes obtuvieron E en geografa

Esta lectura de la cantidad de estudiantes que alcanzaron una valoracin determinada es lo que se llama FRECUENCIA. Al listado de logros dispuestos en forma aleatoria se le llama distribucin de datos, a la forma de organizarlos en una tabla se le denomina tabla de frecuencias.

CLASES DE FRECUENCIASFRECUENCIA ABSOLUTAS: (f) Resultan del conteo directo, de los datos que se repiten en una distribucin. La suma de todas las frecuencias absolutas es el tamao de la muestra. fi = nf = f1 + f2 + f3 + ... + fn = n; n es el tamao de la muestra.

Para nuestro ejemplo la tabla de frecuencias absolutas quedara. Logrosf

DIASE43553

20

Algunos datos de esta tabla tienen la siguiente lectura:3 Estudiantes reaprobaron el examen con una valoracin de I (Insuficiente)5 Estudiantes aprobaron el examen con una valoracin de A (Aceptable)3 Estudiantes aprobaron el examen con una valoracin de E (Excelente)

FRECUENCIAS ACUMULADAS:(F)Se obtiene de la acumulacin sucesiva de las frecuencias absolutas. El ltimo dato acumulado es el tamao de la muestra.Su clculo se obtiene as:F1 = 4F2 = f1+f2 = 4 + 3 =7F3 = f1 + f2 +f3 =4 + 3 + 5 = 12F4 = f1 + f2 + f3 + f4 = 4 + 3 + 5 + 5 = 17F5 = f1 + f2 + f3 + f4 + f5 = 4 + 3 + 5 + 5 + 3 = 20 En una tabla de frecuencias se observara as: LogrosfF

DIASE4355347121720

20

Algunos datos de esta tabla para las frecuencias acumuladas tienen la siguiente lectura:12 Estudiantes reaprobaron el examen con una valoracin inferior a A 7 Estudiantes presentan valoraciones inferiores a A. FRECUENCIA ABSOLUTA RELATIVA: (h)Corresponde a una porcin de distribucin. Se obtiene dividiendo la frecuencia absoluta de cada dato entre el total de elementos que conforman la muestra.

La suma de todas las frecuencias relativas representa al 100% de la poblacin y equivale a 1 (Uno). h = 100% = 1En nuestro ejemplo de referencia.

h1 = 4 / 20 = 0.2 = 20%h2 = 3 /20 = 0.15 = 15%h3 = 5 /20 = 0.25 = 25%h4 = 5 /20 = 0.25 = 25%h5 = 3/20 =0.15 = 15%En una tabla de frecuencias se observara as: LogrosfFh

DIASE43553471217200.20.150.250.250.15

201

Algunos datos de esta tabla tienen la siguiente lectura:El 15% de los Estudiantes reaprobaron el examen con una valoracin de I (Insuficiente)El 25% de los Estudiantes aprobaron el examen con una valoracin de A (Aceptable)El 15% de los Estudiantes aprobaron el examen con una valoracin de E (Excelente) FRECUENCIAS RELATIVA ACUMULADAS: (H). Se obtiene de la acumulacin sucesiva de las frecuencias relativas. El ltimo dato acumulado es el 100% de la muestra.Su clculo se obtiene as:H1 = 0.2H2 = h1+h2 = 0.2 + 0.15 =0.35H3 = h1 + h2 +h3 =0.2 + 0.15 + 0.25 = 0.6H4 = h1 + h2 + h3 + h4 = 0.2 + 0.15 + 0.25 + 0.25 = 0.85H5 = h1 + h2 + h3 + h4 + h5 = 0.2 + 0.15 + 0.25 + 0.25 + 0.15 = 1 El ltimo dato acumulado equivale al 100% de la muestra. En una tabla de frecuencias se observara as: LogrosfFhH

DIASE43553471217200.20.150.250.250.150.20.350.60.851

201

Algunos datos de esta tabla para las frecuencias relativas acumuladas tienen la siguiente lectura:El 60% de los estudiantes reaprobaron el examen con una valoracin inferior a A El 35% de los estudiantes presentan valoraciones inferiores a A.

EJEMPLO DE APLICACIN:La siguiente distribucin de datos representa los salarios de 40 trabajadores de un colegio privado de la ciudad de Villavicencio en donde se requiere que el docente trabaje bajo la figura de docente catedrtico. Para el caso se asigna un valor por la hora trabajada de acuerdo a un grado de escalafn emitido el ministerio de educacin nacional.

Los valores de los salarios corresponden en miles de pesos. 30252040283540254520403015302520505050305015304540152028354030152045501510202830 La siguiente tabla muestra los datos organizados con su respectiva frecuencia. La interpretacin de algunos datos queda como tarea para el estudiante.

SALARIOS(En miles de $)fFhH

10110,0250,025

15560,1250,15

206120,150,3

253150,0750,375

283180,0750,45

307250,1750,625

352270,050,675

405320,125 0,8

453350,0750,875

505400,1251

401

FRECUENCIAS PARA DATOS REALES: (Distribuciones para Datos agrupados)

El pagador de un colegio ha organizado una pequea cooperativa de ahorro para docentes la participacin es libre y voluntaria. La siguiente tabla muestra los ahorros de 25 docentes. 200190150148152158100174187188160178153151128137174199103168188127150130175

El dato ms pequeo es 100 y el mayor es 200 Entre estos dos valores es difcil saber si los dems datos se encuentran ms cerca del 100 o del 200 La dificultad radica en que los datos no se encuentran organizados. Para ello establezcamos un orden en los datos propuestos.

100137152174188103148153174188127150158175190128150160178199130151168187200

Como los datos corresponden al ahorro de diferentes profesores, al ponerlos en orden de tamao no estamos perdiendo ninguna informacin de importancia. Si los datos correspondieran a un cdigo u orden estipulado, se perdera informacin valiosa.

Hay una tcnica un poco ms sofisticada para acomodar los datos y poder apreciar la forma en que se encuentran repartidos, denominada: TABLA DE FRECUENCIAS PARA DATOS AGRUPADOS.

Para determinar las frecuencias para datos agrupados se debe seguir los siguientes pasos que involucran clculos matemticos y la utilizacin de algunas formulas de aproximacin utilizada en forma reiterada por muchos autores y con las cuales nos identificaremos en este curso de estadstica.

RANGO:

Es el dato calculado mediante la diferencia entre el dato mximo y mnimo.R = Xmax XminPara el ejemplo propuestoR = 200 - 100 = 100

NMERO DE INTERVALOS: Representado por la letra m y se define mediante la formula.

m = 1 + 3,3*log(n)

Donde n es el tamao de la muestra. El nmero de intervalos no puede ser inferior a 5 ni superior a 16.5 m 16

Algunos utilizan la formula m =

La aproximacin de m se puede hacer por defecto o por excesom = 1 + 3,3*log(25) 5.6

Aqu m se puede trabajar con 6 y seria una aproximacin por exceso, o a 5 y seria una aproximacin por defecto.

AMPLITUD DEL INTERVALO:Determina la distancia que existe entre un dato y otro, se simboliza por C, depende del criterio establecido para presentar la informacin, puede variar la amplitud en cada intervalo, pero se recomienda tener a C constante a lo largo de toda la distribucin de frecuencias, se calcula mediante las formula.

C = = = 17Los intervalos de clase se clasifican como:

INTERVALOS APARENTEMENTE NOMINALES: Son los intervalos utilizados en la clase que utilizamos, tal como resulta en el clculo de la amplitud C

INTERVALOS REALES: Se obtienen a partir de los lmites de los Intervalos nominales restando 0,5 al lmite inferior y sumando 0,5 al lmite superior en todas las clases. Para tal caso se redefine el rango haciendoRango = C * m

Y se compara con el rango original,

Si la diferencia es de 2 unidades o decimales se puede restar solo al dato menor el excedente y se trabaja con limites reales, si la diferencia es mayor a 2 se resta 2 al dato menor y se suman el resto al dato mayor con el objetivo de equilibrar la diferencia dada por el nuevo rango.

Para nuestro caso tenemos que:

Rango= 17*6 = 102Rango original = 100Diferencia con el nuevo rango = 2Xmin 2 = 98

Entonces la distribucin organizada en intervalos, tomara la siguiente forma:

Ahorros fF hH

98.5 _ 115220.080.08

115.5 _ 132350.120.2

132.5 _ 149270.080.28

149.5 _ 1667140.280.56

166.5 _ 1835190.20.76

183.5_ 2006250.241

Total 251

FRECUENCIAS PARA DATOS ENTEROS: (Distribuciones para Datos no agrupados)Corresponde a una organizacin de los datos en donde se recurre a la formacin de intervalos. Por lo general se trabaja para datos enteros. Cuando los datos continuos son menos de 20 se pueden organizar como datos no agrupados.

EJEMPLO.

A la rectora del colegio han llegado 15 cajas con libros de diferentes editoriales para ser revisados y evaluados por los docentes. El encargado de abrir las cajas es el rector del colegio. El deber seleccionar los libros por reas para entregarlos a los respectivos profesores. En el transporte de los libros desde la editorial hasta la rectora sufrieron algunos daos. Los siguientes datos representan las cajas y la cantidad de libros que se han daado por caja.

C1=1C2=2 C3=0C4=5C5=2C6=3C7=1C8= 4C9=3C10=1C11=0C12=3C13=1C14=0C15=5

El rector del colegio desea brindar un informe detallado a los profesores sobre el estado de los libros. El profesor de estadstica le brinda la siguiente tabla de frecuencias para que el informe sea ms claro y sencillo.

No de Libros defectuososNo de cajasfF hH

0330.20.2

1470.260.46

2290.130.59

33120.20.79

41130.0660.586

52150.131

151

IMPORTACION DE LOS DATOS DE EXCELLo primero es orientar la direccin de los datos a analizar hacia una carpeta de trabajo ubicada en nuestro disco duro. Para este caso la carpeta recibe el nombre de ArchivoCompendio. La figura orienta el proceso de dicho direccionamiento.

En data deben estar ubicados los archivos vlidos y que pueden ser llevados a R. Una vez cambiado el directorio para el reconocimiento de la ruta, el archivo que se quiere exportar de Excel se le debe guardar como texto delimitado por tabulaciones en la carpeta destino. Los comandos para exportar son:Comandos en RResultado de la tabla

datos=read.delim("Tasas.txt")attach(datos)datos

Tal como aparece en R los datos exportados bajo el comando read.delim, no es posible aun acceder a estos datos. El comando attach () facilita dicho acceso de tal manera que se pueden hacer operaciones directamente desde el programa. Ahora que los datos estn atachados es posible traerlos mediante la opcin editar del men y editor de datos.

Al digitar esta opcin nos lleva a una ventana en donde se digita el nombre de la tabla que se quiere editar y corregir datos.

Con esto ya se tiene la tabla en donde se pueden hacer todas las correcciones pertinentes.

IMPORTACION DE ARCHIVOS TXTSi los datos no se encuentran en un archivo Excel, se pueden grabar en un archivo txt, en la carpeta destino de trabajo. Los archivos txt tiene el siguiente aspecto

En R, se pueden visualizar con los siguientes comandos

Comandos en RResultado de la tabla

datos=read.table("Nombres.txt")attach(datos)datos

EJERCICIOS DE APLICACION

Ejercicio 1En las aulas del colegio ha brotado un virus. La alcalda en compaa con el hospital de la regin han levantado un estudio para evitar que el virus se expanda en toda la comunidad. La droga que ataca el virus requiere de una dosis que esta sujeta a un peso. Con el objetivo de obtener un peso promedio y brindar la dosis adecuada a todos los estudiantes se ha tomado una muestra de 20 estudiantes y se obtuvieron los siguientes resultados.

30,332,150,252,334,236,454,256,338,1 40,258,260,442,343,362,564,145,246,365,267,3

Determine para el problema una tabla de frecuencia para datos agrupados y realice interpretacin de algunos resultados, de la misma manera llvelos a un archivo txt y crguelos en el programa R.

Ejercicio 2 Los siguientes datos representan 50 (en miles de pesos) salarios de los empleados de la secretaria de educacin. Para tal distribucin de datos realizar la tabla de intervalos de clase.

50300178320350280145220145220200400392235289400230400220256100400270187400175400189100187120180125248400300178256400200150230280300220276235400386400De la misma manera llvelos a un archivo txt y crguelos en el programa R

Ejercicio 3Complete el siguiente cuadro

Intervalos de ClasesIntervalos con limites realesfFhH

20 _ 24

_56

325341232

Total

Cuando el cuadro este completo realice cargue la tabla desde un archivo Excel.

Ejercicio 4Un corto circuito dao dos monitores de la sala de sistemas del colegio, se consult en 30 almacenes de la ciudad el precio de monitores para computador y se obtuvo los siguientes resultados en miles de pesos.

100101120115130150112145138121126115140137143118147149150115100127135149146137122118135129

Elabore una distribucin de frecuencias, para datos agrupados, indicando los valores de los lmites reales. De la misma manera llvelos a un archivo txt y crguelos en el programa R.