Probabilidades y Estadística I
TEMA 2
Medidas características de una distribución de frecuencias
Probabilidades y Estadística I
Esquema inicial
1. Introducción
2. Medidas de Centralización
3. Medidas de Dispersión
4. Medidas de Forma
5. Medidas de Relación
6. Representaciones gráficas. Diagrama de caja
7. Transformaciones de datos
Probabilidades y Estadística I
Esquema inicial
1. Introducción
2. Medidas de Centralización
3. Medidas de Dispersión
4. Medidas de Forma
5. Medidas de Relación
6. Representaciones gráficas. Diagrama de caja
7. Transformaciones de datos
Probabilidades y Estadística I
3. Medidas de dispersión (5/11)
Cuartiles (idea intuitiva)
25% 25% 25% 25%
Son los valores que dividen la muestra en 4 grupos, cada uno con el 25% de los datos (aproximadamente)
25% 25% 25% 25%
Q1 Q2 Q3min max Q1 Q2 Q3min max
Rango intercuartílico
Probabilidades y Estadística I
3. Medidas de dispersión (6/11)
(definición formal)
Sea x1, x2, ...., xn una serie de datos y sea x(1) ≤ x(2) ....≤ x(k) la serie ordenadade menor a mayor.
Sea X una variable estadística y F(x) su función acumulativa de frecuencias relativas. Se define Qi como la solución de la siguiente ecuación funcional
F(x) = i/4
Datos explícitos
Datos implícitos
( )
( ) ( )
jn4ij si
xx
n4ij six
Qjj
j
i
+<+<+
+==
+ 1)1(2
)1(
1
Cuartiles
Probabilidades y Estadística I
3. Medidas de dispersión (7/11)
(definición intuitiva)Percentiles
Son los valores que dividen la muestra en 100 grupos, cada uno con el 1% de los datos (aproximadamente)
P25 P50 P75min maxQ1 Q2 Q3
Probabilidades y Estadística I
3. Medidas de dispersión (8/11)
(definición formal)
Sea x1, x2, ...., xn una serie de datos y sea x(1) ≤ x(2) ....≤ x(k) la serie ordenadade menor a mayor.
Sea X una variable estadística y F(x) su función acumulativa de frecuencias relativas. Se define Qi como la solución de la siguiente ecuación funcional
F(x) = i/100
Datos explícitos
Datos implícitos
( )
( ) ( )1
i si j ( 1) x x i si j ( 1) 1
2
100
100
j
ij j
x nP
n j+
= += + < + < +
Percentiles
Probabilidades y Estadística I
3. Medidas de dispersión (9/11)
Varianza (definición formal)
Sea x1, x2, ...., xn una serie de datos
2 2 22 1 2( ) ( ) .... ( )nx x x x x x
nσ − + − + + −
=
Datos explícitos
Sea X una variable estadística y {x’1,x’2,...,x’k} el conjunto finito de modalidades. Sea {f1,f2,.…,fk} su distribución de frecuencias relativas.
( )∑=
−=k
iii xxfVar
1
2'X
Datos implícitos
Probabilidades y Estadística I
3. Medidas de dispersión (10/11)
Desviación típica (definición formal)
( )∑=
−+=k
iii xxf
1
2'σ
)2,2( σσ +− x x contiene el 75% de los datos
( 3 , 3 )x xσ σ− + contiene el 89% de los datos
Detectar datos
atípicos
Probabilidades y Estadística I
3. Medidas de dispersión (11/11)
Varianza (propiedades)
Var (aX+b)= a2Var(X)
Es un operador cuadrático (Teorema de Pitágoras)
COMPARACIÓN DE DISPERSIONES (Coeficiente de variación)
xCV σ
=
Probabilidades y Estadística I
Esquema inicial
1. Introducción
2. Medidas de Centralización
3. Medidas de Dispersión
4. Medidas de Forma
5. Medidas de Relación
6. Representaciones gráficas. Diagrama de caja
7. Transformaciones de datos
Probabilidades y Estadística I
4. Medidas de forma (1/6)
Una forma de valorar cuantitativamente la forma del perfil de una distribución de frecuencias
¿qué valores de una distribución pueden considerarse atípicos?
Apuntamiento Curtosis
Simetría Coeficiente de Fisher
Criterio MedidaGráfico
Probabilidades y Estadística I
4. Medidas de forma (2/6)
Momento centrado en el origen (definición formal)
Sea x1, x2, ...., xn una serie de datos, se denomina momento centrado en el origen de orden r, y se representa por ar, a la siguiente expresión algebraica:
n x.... x x
ar
n
r
2
r1
r+++
=
Momento centrado en la media (definición formal)
Sea x1, x2, ...., xn una serie de datos, se denomina momento centrado en el origen de orden r, y se representa por ar, a la siguiente expresión algebraica:
n x(x....x(x x(x
mr
nr
2r
1r
))) −++−+−=
Probabilidades y Estadística I
4. Medidas de forma (3/6)
Momentos (propiedades)
m1= 0m2 = Var (X)
a1= x
Var (X) = m2 = a2 – a12
2n n2i i
i 1 i 1x x
Var(X)n n
= =
= −
∑ ∑
Probabilidades y Estadística I
4. Medidas de forma (4/6)
Coef. de Fisher
n3
i3 i 1
1 3 3
(x x)m
n=
−γ = =
σ σ
∑
1 0γ =1 0γ < 1 0γ >
(definición formal)
Probabilidades y Estadística I
4. Medidas de forma (5/6)
Curtosis (definición formal)
n4
i4 i 1
2 4 4
(x x)m 3 3
n=
−γ = − = −
σ σ
∑
2 0γ =2 0γ < 2 0γ >
Probabilidades y Estadística I
4. Medidas de forma (6/6)
Datos atípicos
No atípico Atípico
Probabilidades y Estadística I
Esquema inicial
1. Introducción
2. Medidas de Centralización
3. Medidas de Dispersión
4. Medidas de Forma
5. Medidas de Relación
6. Representaciones gráficas. Diagrama de caja
7. Transformaciones de datos
Probabilidades y Estadística I
5. Medidas de relación (1/4)
Una forma de valorar cuantitativamente la relación lineal entre dos variables
Eliminar información redundante. Establecer causalidades
Probabilidades y Estadística I
5. Medidas de relación (2/5)
Momento centrado en el origen (definición formal)
Sea (x1,y1), (x2,y2),...., (xn,yn) una serie de datos bidimensionales que definen la variable estadística bidimensional (X, Y).
r h r h r h1 1 2 2 n n
rhx y x y .... x y a
n+ + +
=
Momento centrado en la media (definición formal)
Sea (x1,y1), (x2,y2),...., (xn,yn) una serie de datos bidimensionales que definen la variable estadística bidimensional (X, Y).
r h r h r h1 1 2 2 n n
r ,h(x X ) (y Y ) (x X ) (y Y ) .... (x X ) (y Y ) m
n− − + − − + + − −
=
Probabilidades y Estadística I
5. Medidas de relación (3/5)
Momentos bid. (interrelaciones)
COVARIANZA
Probabilidades y Estadística I
5. Medidas de relación (4/5)
Covarianza
DEPENDE DE LA MAGNITUD
Cov (X, Y) = m11
Probabilidades y Estadística I
5. Medidas de relación (5/5)
Coeficiente de correlación (covarianza normalizada)
x ,yx y
cov( X ,Y )ρσ σ
= x ,y1 1ρ− ≤ ≤
X
Y
X
Y
X
Y
X
Y
x ,y 1ρ = − x ,y1 0ρ− < <X
Y
X
Y
X
Y
X
Y
x ,y 0ρ =
X
Y
X
Y
X
Y
X
Y
x ,y0 1ρ< < x ,y 1ρ =
Recommended