Profesores: Walter Sosa Escudero Mariana Marchionni Asistentes: María Edo M. Amelia Gibbons
Preview:
Citation preview
- Diapositiva 1
- Profesores: Walter Sosa Escudero Mariana Marchionni Asistentes:
Mara Edo M. Amelia Gibbons
- Diapositiva 2
- Organizacin de la parte prctica del curso Introduccin a Stata
Interface Datos Comandos Grficos Do-file
- Diapositiva 3
- Pgina web del curso:
http://faculty.udesa.edu.ar/WalterSosa/Econometria/ Trabajos
Prcticos: Reglas: grupos de 3 personas Entrega: impresa (en
casillero) y por correo electrnico, en PDF. Esperar acuse de
recibo. Monografa. Entrega: con el final. Metodologa clases
prcticas: Introduccin a Stata Desarrollo de ejemplos economtricos
Desarrollo de ejercicios tericos y empricos Espacio de consulta
para la realizacin de los trabajos prcticos y la monografa.
- Diapositiva 4
- Stata es un sistema que permite la gestin de base de datos y la
realizacin de clculos estadsticos y economtricos. Fuentes de
informacin: Hamilton, L., 2012, Statistics with Stata: Version 12,
Duxbury Press, New York. Baum., C., 2006, An Introduction to Modern
Econometrics with Stata, Stata Press. Ambos libros estn en reserva
en la biblioteca. www.stata.com
- Diapositiva 5
- La interface de Stata comprende el entorno de trabajo. Las
diferentes ventanas que conforman la interface son: Ventana Review:
historial de comandos. Ventana Variables: expone las variables que
comprenden el dataset actualmente en memoria. Ventana Stata
Results: es la ventana ms grande color negro. Muestra los
resultados obtenidos de la aplicacin de los comandos. Ventana Stata
comand: en esta ventana el usuario introduce comandosmediante el
teclado.
- Diapositiva 6
- Estructura: tabla, en donde cada columna representa a una
variable y cada fila a una observacin. En cada celda se pueden
guardar datos de diferentes tipos. El tipo de dato es el mismo para
las observaciones de una misma variable A partir de ahora,
utilizaremos una base de datos extrada de la EPH, correspondiente
al tercer trimestre de 2011 para ejemplificar. Observaci n Variable
1Variable 2Variable K 1Dato 1, 1Dato 2, 1Dato K, 1 2Dato 1, 2Dato
2, 2Dato K, 2 NDato 1, NDato 2, NDato K, N
- Diapositiva 7 Change Working Directory Lectura de Datos en
Stata: dist"> Change Working Directory Lectura de Datos en
Stata: distintas opciones Base de datos en formato Stata (.dta):
podemos abrirlo directamente en Stata. use eph_2011_t3.dta. Base de
datos en excel: tenemos un archivo excel con datos, llamado
eph_2011_t3.xls. Cada columna representa una variable; la primera
fila contiene los nombres de dichas variables. Dos mtodos:">
Change Working Directory Lectura de Datos en Stata: dist"
title="Establecer un directorio: cd "C:\Users\DE\Dropbox\econometra
2014\x - Tutorial 1 Archivo -> Change Working Directory Lectura
de Datos en Stata: dist">
- Establecer un directorio: cd "C:\Users\DE\Dropbox\econometra
2014\x - Tutorial 1 Archivo -> Change Working Directory Lectura
de Datos en Stata: distintas opciones Base de datos en formato
Stata (.dta): podemos abrirlo directamente en Stata. use
eph_2011_t3.dta. Base de datos en excel: tenemos un archivo excel
con datos, llamado eph_2011_t3.xls. Cada columna representa una
variable; la primera fila contiene los nombres de dichas variables.
Dos mtodos:
- Diapositiva 8
- Mtodo 1 (Copy & Paste): Abrir el archivo eph_2011_t3.xls en
Excel Abrir Stata. En Excel, pintar todo el rango de datos que se
desea llevar a Stata (incluyendo los nombres de las variables].
Clickear Edicion/Copiar. Pasar a Stata, abrir el editor de Stata
clickeando en el botn Editor. En esta ventana, clickear Edit/Paste,
Los nombres de las variables aparecern en la ventana Variables.
Nota: Este mtodo puede tener problemas si no se dispone de
suficiente memoria RAM, por lo que es til chequear si todos los
datos han sido importado correctamente. Nota II: Stata requiere
criterios particulares para los nombres de las variables.
- Diapositiva 9
- Mtodo 2 (Insheet) Grabar el archivo conteniendo los datos en
Excel como CSV (separa las columnas en comas]. Ir a Archivo,
Guardar como, CSV (delimitado por comas], Guardar Ahora tenemos el
archivo eph_2011_t3.csv El archivo est en la siguiente ruta: c:
\Users\DE\Dropbox\econometra 2014\ x Tutorial 1\ eph_2011_t3.csv
Para leer los datos desde Stata, ingresar el siguiente comando:
insheet using "c:\Users\DE\Dropbox\Econometra 2014\x - Tutorial
1\eph_2011_t3.csv", comma Stata crear una nueva base de datos, y
los nombres de las variables aparecern en la ventana
Variables.
- Diapositiva 10
- Una vez que la base de datos ha sido abierta en Stata, puede
grabarse en formato Stata: Archivo -> Guardar Como ->
eph_2011_t3.dta Una vez grabada con la extensin.dta puede abrirse
directamente desde Stata: Archivo -> Abrir use eph_2011_t3.dta,
clear [clear limpia la base de datos, se usa si o si antes de abrir
una nueva] A partir de ahora, abrir directamente desde Stata el
archivo eph_2011_t3.dta original (contiene las etiquetas de las
variables)
- Diapositiva 11
- Stata trabaja mediante la especificacin por parte del usuario
de rdenes que se denominan comandos Existe una determinada sintaxis
que debe ser respetada. Tiene la siguiente estructura general: [by
varlist:] comando [varlist] [=exp] [if exp] [in range] [weight] [,
opciones] Los corchetes indican elementos opcionales. Todos los
elementos que acompaan a un comando son opciones, de hecho existen
comandos que comprenden slo una palabra. Para conocer las opciones
de los comandos: help comando
- Diapositiva 12
- display _N [cantidad de observaciones en la base de datos]
describe [describe el dataset] describe ch04 [describe una variable
en particular] list [muestra todas las variables y observaciones
para interrumpir clickear break] list CODUSU ch04 [muestra
observaciones para las variables seleccionadas] sort CODUSU [ordena
las observaciones en forma ascendente de acuerdo a los valores de
CODUSU]
- Diapositiva 13
- summarize [muestra resumen de todas las variables] summarize
CODUSU ch04 [muestra resumen variables seleccionadas] summarize
CODUSU, detail [muestra resumen ms detallado de variables
seleccionadas] summ tabulate ch04 [tabula la variable seleccionada]
tab ch04 ch07 [tabula las variables seleccionadas] tab ch04 ch07,
row [tabula las variables seleccionadas incluyendo porcentajes
adems de frecuencias]
- Diapositiva 14
- statnameDefinicin meanpromedio count Cuenta las observaciones
que no son nulas nIgual que count sumSuma maxMximo minMnimo
rangeRango = max min sdDesvo Estndar varianceVarianza cvCoeficiente
de variacin (sd/mean) semean Desvi estndar del promedio
(sd/sqrt(n)) p1Primer percentil medianMediana (p50) p99Percentil 99
iqrRango intercuartil= p75 - p25 tabstat ch04 [muestra la media de
la variable seleccionada] tabstat ch04, statistics (mean sum count
max) [genera una tabla que muestra los estadisticos descriptivos
indicados entre parntesis] Posibles estadsticos:
- Diapositiva 15
- generate ingreso=tot_p12/7 [genero una variable nueva que
contiene el ingreso medido en dlares] gen obs=_n [genera una nueva
variable llamada obs que enumera las observaciones segn su orden]
gen obs_total=_N [crea una variable cuyo valor siempre es el mismo
y ese valor es la cantidad de observaciones] gen nulo=. gen
x=uniform()[ genera una variable con nmeros aleatorios entre 0 y 1]
gen edad2=ch06^2 [genera una variable que es el cuadrado de la
edad] egen horas = rowtotal(pp3e_tot pp3f_tot) [genera una variable
que es la suma horizontal de las variables seleccionadas]
- Diapositiva 16
- Preserve and restore ctrl+Z! En Stata no existe un comando
Deshacer preserve [guarda provisionalmente la base de datos]
restore [vuelve a la versin guardada provisionalmente] Modificar la
base de datos como en Excel edit label var ingreso Ingreso total en
Dlares [etiqueta la variable Ingreso] rename ingreso
ingreso_dolares [cambia el nombre de la variable ingreso] replace
ch04=0 if ch04==2 [ahora cuando la variable es igual a 0 significa
que el individuo es mujer] drop horas [elimina la variable horas]
keep if ch06
- La expresin if sum horas if ch04==1 [ejecuta el comando
summarize en la submuestra seleccionada: los hombres] tab horas if
(ch04==1 & ch06>30) [tabula la variable horas en la
submuestra seleccionada: hombres mayores de 30 aos] tab horas if
(ch04==1 & ch06>30)| (ch04==2 & ch06
- AritmticosLgicosRelacionados + adicin& y> mayor a -
resta| o< menor a * multiplicacin! no>= mayor o igual a /
divisin 30)|(ch04==2 & ch06 View".">
- Antes de empezar: existe un comando que genera un archivo
llamado log. Son tiles para llevar un registro de todo lo que
aparece en la ventana "resultados. Los log-file graban tanto el
historial de los comandos como los resultados. log using
"c:\Users\DE\Dropbox\Econometra 2014\x - Tutorial 1\
eph_2011_t3.smcl" [options] replace append log close Se puede abrir
el log file con el Bloc de notas o mediante la opcin File -> Log
-> View".