14
1 Temas Selectos en Métodos Cuantitativos Introducción Javier Aparicio División de Estudios Políticos, CIDE [email protected] Otoño 2008 http:// www.cide.edu/investigadores/aparicio/metodos.html

1 Temas Selectos en Métodos Cuantitativos Introducción Javier Aparicio División de Estudios Políticos, CIDE [email protected] Otoño 2008

Embed Size (px)

Citation preview

Page 1: 1 Temas Selectos en Métodos Cuantitativos Introducción Javier Aparicio División de Estudios Políticos, CIDE javier.aparicio@cide.edu Otoño 2008

1

Temas Selectos enMétodos Cuantitativos

Introducción

Javier AparicioDivisión de Estudios Políticos, CIDE

[email protected]

Otoño 2008

http://www.cide.edu/investigadores/aparicio/metodos.html

Page 2: 1 Temas Selectos en Métodos Cuantitativos Introducción Javier Aparicio División de Estudios Políticos, CIDE javier.aparicio@cide.edu Otoño 2008

2

¿Para qué sirven los métodos cuantitativos? Ante la dificultad de allegarse datos experimentales en

Ciencias Sociales, utilizamos datos NO experimentales (observational data) para hacer inferencias

Para verificar las hipótesis o predicciones de cierta teoría con datos del “mundo real”

Para estimar la magnitud y significancia de una relación empírica

Para validar hipótesis o teorías rivales: ie, efecto de una política pública

Page 3: 1 Temas Selectos en Métodos Cuantitativos Introducción Javier Aparicio División de Estudios Políticos, CIDE javier.aparicio@cide.edu Otoño 2008

3

Breviario metodológico

¿Investigación cualitativa vs. cuantitativa? El método idóneo depende tanto de tu pregunta de investigación como del tipo de respuesta que buscas obtener

Una investigación cuantitativa seria tiene al menos cuatro elementos (King et al., 1994):

Inferencia descriptiva (exploración de datos) e inferencia explicativa (exploración de mecanismos causales).

Replicabilidad: Procedimientos de recolección de datos, codificación y análisis explícitos, claros y generalizables.

Conclusiones probabilísticas (con incertidumbre): de datos inciertos sólo pueden seguirse conclusiones ídem.

“The content is the method”: La investigación será más o menos científica si y sólo si sigues un método.

Page 4: 1 Temas Selectos en Métodos Cuantitativos Introducción Javier Aparicio División de Estudios Políticos, CIDE javier.aparicio@cide.edu Otoño 2008

4

Small n vs. large n

Distintos tamaños de muestra imponen retos diferentes Muestras grandes permiten identificar patrones fácilmente

generalizables a lo largo de casos más o menos comparables, mientras que muestras pequeñas permiten estudiar a profundidad la complejidad y/o peculiaridad de cada caso.

Una observación puede ser tan simple como un punto en un plano de k dimensiones--mismo que ponemos en perspectiva al compararlo con otras observaciones manteniendo constantes otras variables--o tan denso como el sinnúmero de fenómenos que se entrecruzan en un episodio histórico.

“The curse of dimensionality” A mayor N, mayor precisión tendrán los estimadores de una

regresión, lo cual fortalece tus resultados... ...pero a mayor N, el número de posibles variables relevantes

también aumenta, lo que puede debilitar tu teoría o tus resultados iniciales.

Page 5: 1 Temas Selectos en Métodos Cuantitativos Introducción Javier Aparicio División de Estudios Políticos, CIDE javier.aparicio@cide.edu Otoño 2008

5

Objetivos del Diseño de Investigación – Mejores Teorías Mejorar tu pregunta de investigación. Tu pregunta de

investigación debe: Ser "importante" para el "mundo real“ (so what?). Hacer una contribución específica a la literatura existente.

Mejorar las teorías existentes Busca teorías falsificables (a la Popper) o que podrían estar

equivocadas--¿qué evidencia te bastaría para demostrarte que tu teoría/creencia está equivocada?)

Busca teorías con las mayores "implicaciones observables" posibles--¿cuántas hipótesis se desprenden de tu teoría?

Tu teoría debe ser clara y concreta, quizá elegante, quizá parsimoniosa.

Page 6: 1 Temas Selectos en Métodos Cuantitativos Introducción Javier Aparicio División de Estudios Políticos, CIDE javier.aparicio@cide.edu Otoño 2008

6

Objetivos del Diseño de Investigación – Mejor Evidencia Mejorar la calidad de la evidencia existente

Registra todo el proceso de recabación de datos replicabilidad. Recaba datos sobre el mayor número de "implicaciones

observables" posibles robustez¿Puedes recabar más datos? ¿Puedes usar alguna otra variable dependiente?

Maximiza la validez de tus observaciones: ¿tus datos en verdad miden lo que quieres?

Asegúrate de que tu recolección de datos es confiable.

Mejorar el uso de la evidencia existente Evita sesgos: usa tus datos para generar inferencias no sesgadas

que en promedio sean correctas. Maximiza la eficiencia:  explota la mayor cantidad posible de

información contenida en tus datos minimiza la varianza de tus inferencias.

Page 7: 1 Temas Selectos en Métodos Cuantitativos Introducción Javier Aparicio División de Estudios Políticos, CIDE javier.aparicio@cide.edu Otoño 2008

7

Datos: Corte transversal (cross-sectional)

Muestra aleatoria de una población Observaciones a nivel individual, local, nacional, etc., en

un momento dado en el tiempo Pro: permite explotar la varianza o heterogeneidad entre

observaciones Contra:

¿son realmente comparables unos casos con otros? No observamos un mismo caso en el tiempo (no observamos el

antes/despúes).

Si la muestra no es aleatoria o representativa Problema de sesgo muestral / selección muestral

Page 8: 1 Temas Selectos en Métodos Cuantitativos Introducción Javier Aparicio División de Estudios Políticos, CIDE javier.aparicio@cide.edu Otoño 2008

8

Datos: Panel / Longitudinales

Datos agrupados (pooled cross-section): acumular diferentes cortes de datos y tratarlos como una sola muestra, controlando por diferencias temporales, regionales, etc.

Datos panel: permiten observar cierto individuo/región a lo largo del tiempo.

T > N: Time series/cross-section explotan la dinámica de los grupos (time-series asymptotics)

T < N: Datos panel o longitudinales explotan la heterogeneidad de los grupos (cross-section asymptotics)

Page 9: 1 Temas Selectos en Métodos Cuantitativos Introducción Javier Aparicio División de Estudios Políticos, CIDE javier.aparicio@cide.edu Otoño 2008

9

Datos: Series de Tiempo

Observaciones de una sola unidad a lo largo del tiempo: inflación, tasas de interés, abstencionismo, número de denuncias.

Una serie de tiempo difícilmente será una muestra aleatoria (iid): Inercia (path dependence) Correlación temporal entre observaciones Tendencias de largo plazo Estacionalidad (seasonality) Cambios de corto vs. largo plazo

Page 10: 1 Temas Selectos en Métodos Cuantitativos Introducción Javier Aparicio División de Estudios Políticos, CIDE javier.aparicio@cide.edu Otoño 2008

10

El Problema de la Causalidad

Afecta a estudios cuantitativos y cualitativos por igual. Hallar una correlación entre dos o más variables NO

establece causalidad. De encontrar cierta correlación o efecto, ¿cómo podemos

saber si en verdad X causó a Y? One can only hope: Estadísticamente, si controlamos por

suficientes variables adicionales (covariates), es plausible que, ceteris paribus, el efecto hallado sea causal…

Theory to the rescue! La teoría subyacente nos dice qué factores determinan qué variables. La evidencia empírica simplemente apoyará o rechazará las hipótesis derivadas de la teoría.

Page 11: 1 Temas Selectos en Métodos Cuantitativos Introducción Javier Aparicio División de Estudios Políticos, CIDE javier.aparicio@cide.edu Otoño 2008

11

Ejemplo: Rendimiento de la educación Teoría: Un modelo de inversión en capital humano

implica que a mayor educación, mayores ingresos. En el modelo más simple, esto implica una ecuación a

estimar del tipo:

ueducationEarnings 10

Page 12: 1 Temas Selectos en Métodos Cuantitativos Introducción Javier Aparicio División de Estudios Políticos, CIDE javier.aparicio@cide.edu Otoño 2008

12

. reg EARNINGS SCHOOL

Source | SS df MS Number of obs = 540-------------+------------------------------ F( 1, 538) = 112.15 Model | 19321.5589 1 19321.5589 Prob > F = 0.0000 Residual | 92688.6722 538 172.283777 R-squared = 0.1725-------------+------------------------------ Adj R-squared = 0.1710 Total | 112010.231 539 207.811189 Root MSE = 13.126

------------------------------------------------------------------------------ EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval]-------------+---------------------------------------------------------------- SCHOOL | 2.455321 .2318512 10.59 0.000 1.999876 2.910765 _cons | -13.93347 3.219851 -4.33 0.000 -20.25849 -7.608444------------------------------------------------------------------------------

6

Page 13: 1 Temas Selectos en Métodos Cuantitativos Introducción Javier Aparicio División de Estudios Políticos, CIDE javier.aparicio@cide.edu Otoño 2008

13

-20

0

20

40

60

80

100

120

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Years of schooling

Ho

url

y ea

rnin

gs

($)

7

SEARNINGS 46.293.13 ^

Page 14: 1 Temas Selectos en Métodos Cuantitativos Introducción Javier Aparicio División de Estudios Políticos, CIDE javier.aparicio@cide.edu Otoño 2008

14

Ejemplo… El estimador de 1 es el rendimiento de la educación, ¿pero será

este un efecto causal? El término de error o residual, u, incluye info sobre todos los

demás factores que afectan las ganancias pero que no han sido incluidos en el modelo.

Debemos controlar por tantos factores como nos sea posible (confounding factors, covariates, etc.)

Ojo: al final siempre habrá factores no observables que afectan las ganancias: son parte del residual.

Endogeneidad: a) quizá las ganancias cuando joven te ayudan a estudiar un posgrado (X determina a Y, y viceversa). b) quizá tanto educación como ganancias están determinadas “simultáneamente” por una variable omitida (IQ, por ejemplo).