Nivelacion Stata MPP 2011
-
Upload
elizabeth-collins -
Category
Documents
-
view
49 -
download
9
Transcript of Nivelacion Stata MPP 2011
-
DEPARTAMENTO DE ECONOMA UNIVERSIDAD DE CHILE
1
Curso Nivelacin STATA
Magster en Polticas Pblicas
Javiera E. Vsquez N. 1
1 Investigadora , Centro de Microdatos, Departamento de Econ oma, Universidad de Chile ( [email protected] ) . Cualquier error es responsabilidad exclusiva del autor. Se agradece a J.
Eguiguren los comentarios y cooperacin en la elaboracin de este apunte.
mailto:[email protected] -
DEPARTAMENTO DE ECONOMA UNIVERSIDAD DE CHILE
2
TABLA DE CONTENIDOS
INTRODUCCIN 3
I. UNA PEQUEA INTRODUC CIN AL PROGRAMA 4
II. COMO ORGANIZAR EL TR ABAJO EN STATA 6
III. CMO CARGAR UNA BAS E DE DATOS? 8
IV. LEYENDO LOS DATOS 14
IV.1. DESCRIBE 15 IV.2. CODEBOOK 17 IV.3. EDIT 19 IV.4. IST ; INSPECT ; DUPLICATES ; COUNT ; ORDER 20 IV.5. SUM 23 IV.6. TABULATE 27
V. MODIFICACIN DE UNA BASE DE DATOS. 34
V.1. MODIFICACIN DE VARIABLES DE UNA BASE DE DATOS 34 V.2. UNIR BASES DE DATOS : MERGE Y APPEND 39 V.3. CONDENSAR UNA BASE DE DATOS : COLLAPSE 48 V.4. CAMBIAR LA ESTRUCTURA DE LA BASE DE DATOS : RESHAPE 49 V.5. ELIMINAR VARIABLES : KEEP Y DROP 52 V.6. CREAR VARIABLES : GENERATE Y EGEN 54
VI. APLICANDO LO APRENDI DO 57
VI.1. UN EJEMPLO APLICADO 57 VI.2. ARCHIVOS LOG 62
VI.3. ARCHIVOS DO : PARA TRABAJAR EN FOR MA PROGRAMADA EN STATA 64
VII. CREAR MATRICES PARA GUARDAR LOS DATOS 77
VIII. CICLOS RECURSIVOS 79
IX. GRFICOS 79
X. AYUDA: HELP 91
-
DEPARTAMENTO DE ECONOMA UNIVERSIDAD DE CHILE
3
Introduccin
Este documento pretende los introducir el uso del progra ma STATA, mediante la
entrega de conceptos y comandos bsicos para el inicio en este software. En una
primera parte haremos una pequea introduccin al programa, luego veremos
brevemente como se carga una base de datos , y en una tercera parte se ver cual es
la manera ms adecuada de trabajar con ella . Adicionalmente, e n una cuarta parte se
vern los comandos que comnmente se utilizan para inspeccionar una base de datos
y obtener estadsticas descriptivas de sus variables, especficamente veremos
comandos como sum, el cual nos entrega un set de estadsticas bsicas de la variable ,
describe , y varios otros. En una quinta parte se enseara como se pueden modificar
las bases de datos, especialmente, cam biando el nombre de las variables, unir bases
de datos, e liminar y agregar variables , cambiar la estructura de ellas y crear nuevas
variables a partir de las variables existentes.
En una sexta parte se aplicar lo aprendido y a partir de ese ejercicio se introducir la
utilidad de los archivos log y do. En la s ptima parte se mostrar cmo podemos
plasmar l a informacin que nos interesa de los datos en diferentes tipos de grfi cos.
Finalmente en la octava y ltima parte se ensear la utilidad del comando help , el
cual no s ser de gran utilidad para poder avanza r y utilizar stata cuando no tenemos
muy claro cual es el comando a utilizar.
Es importante aclarar que gran parte de los comandos de stata se puede hacer
mediante la utilizacin directa del comando, o mediante la utilizacin de ventanas .
Durante este cur so veremos ambas formas .
Un concepto importante de entender antes de comenzar a utilizar este software
estadstico , es el de Base de Datos , el primer paso para poder trabajar con STATA es
cargar la base de datos. Una base de datos en un conjunto (matriz) de informacin,
tenemos filas y columnas, las que en su conjunto forman la base de datos.
Generalmente se organiza de forma tal que las variables se representan por columnas
y las observaciones por filas. Por ejemplo, si estamos estudiando las variables
escolaridad e ingreso para las mujer es. Nuestra base de datos tendr dos columnas,
donde cada una de ellas representa la escolaridad e ingreso, y cada fila representa una
mujer.
escolaridad Ingreso
10 80.000
12 120.000
13 110.000
4 85.000
5 70.000
8 65.000
17 450.000
21 1.200.000
2 60.000
-
DEPARTAMENTO DE ECONOMA UNIVERSIDAD DE CHILE
4
I. Una pequea introduccin al programa
STATA es una aplicacin completa e integrada, basada en comandos, que tiene todos
los elementos necesarios para realizar anlisis estadstico, manejo de datos
estadsticos y grficos. Las versiones mas nuevas de S TATA (a partir de la versin 8.0)
posee una forma ms fcil de utilizar, que consiste simplemente en hacer clic en
ventanas con las opciones de anlisis y procesamiento de datos, adems tiene la
nte los comandos. El programa posee una ayuda en lnea, es un
programa fcil y rpido de utilizar.
Cmo se ve STATA?
Cuando abrimos el programa , inmediatamente podemos distinguir 4 ventanas :
Review: en esta ventana aparecen los comandos que han sido u tilizados
durante la seccin en turno.
Results: muestra los resultados de la aplicacin de los comandos, slo los
resultados ms recientes son visibles en esta ventana
Variables: en esta venta se presenta el listado de variables que se encuentran
en la bas e de datos que se este trabajando
Commands: corresponde a la ventana donde introducen los comandos para
obtener el resultado de seado. Sirve para utilizar STATA en forma interactiva.
-
DEPARTAMENTO DE ECONOMA UNIVERSIDAD DE CHILE
5
Los conos de la parte superior tienen los siguientes usos:
Abrir u na base de datos
Guardar una base de datos, una vez que ha sido modificada en el programa
Impr imir los resultados de la ventan a de resultad os (STATA Results)
Comenzar o abrir un archivo log . Estos archivos tienen u n formato de texto y
permite n ir gu ardando todos los resultados.
Abrir el editor de do - file. Los archivos do son archivos con esta extensin que nos
permiten en forma ordenada escribir todo lo que queremos hacer en nuestra base de
, y luego presionando
correr dicho do y obtener los resultados. 2
Permite ver y editar la Base de Datos.
Es igual al EDITOR, pero no permite eliminar variables ni observaciones.
Es para detener la ejecucin de un comando.
2 Lo ideal es combinar la utilizacin de un do y un log ; el primero permite tener en forma ordenada todos los comandos que se estn utilizando y todas las instrucciones que se quieren ejecutar, mientras que e l
segundo guarda en un archivo de texto todos los resultados que surgen de este archivo do.
-
DEPARTAMENTO DE ECONOMA UNIVERSIDAD DE CHILE
6
II. Como o rganizar el trabajo en ST ATA
Cuando se abre STATA es importante saber donde se esta trabajando, es decir, en que
carpeta se estn guardando los resultados o des de que carpeta vamos a llamar l a base
de datos , etc. Si no se sabe la carpeta o directorio donde STATA esta ubicado podemos averiguarlo escribiendo el comando pwd:
pwd
C: \ data Este resultado nos indica que estamos ubicados en el disco C del
computador en la carpeta data
Para cambiar el directorio o carpeta se debe realizar lo siguiente :
cd C: \ Nivelacion_Stata
Utilizo el comando cd y entrego la nueva ruta. En este caso le estoy indicando al
C del computador.
La ventaja de indicar desde un comien zo en que carpeta del computador se esta
trabajando, es que evita indicar la ruta completa de los archivos cada vez que
queramos abrir o guardar una base de datos, o abrir o guardar un log. Obviamente
esto tiene sentido cuando para un trabajo especfico te nemos todos los archivos
necesarios en la misma carpeta.
Por ejemplo, si estamos trabajando con informacin de tres bases de datos distintas, y
queremos dejar la informacin relevante para el estudio en una sola base datos (ms
adelante veremos como hace r esto), lo ideal es trabajar en una sola carpeta,
.
Si no estn en la misma carpeta no es til indicarle el directorio al comienzo, ya que
igual cuando llamemos a cada una de las bases de datos, al estar en carpetas
distintas, tendremos que cambiar la ruta.
Importante : los sistemas operativos ms nuevos permiten que las carpetas tengan
no va a reconocer una carpeta que tenga espacios en blanco en el nombre, a no se r
que se indique la ubicacin de esta carpeta entre comillas. Por este motivo , se debe
evitar llamar a una carpeta con la que van a trabajar en STATA con nombres q ue
contengan es pacios en blanco .3
3 Esto problema es comn cuando trabajan en el Escritorio del computador, ya que la carpeta en este caso es C: \ Documents and Settings \ ...., tiene espacios en blanco.
-
DEPARTAMENTO DE ECONOMA UNIVERSIDAD DE CHILE
7
primera lnea del siguiente cuadro podemos apreciar que al entregar la ubicacin de la carpeta utilizando el comando cd , el programa nos entrega un e
esto se debe a que el nombre de la carpeta tiene espacios en blanco. Si agregamos
comillas a la ruta no se produce el err or.
Nota: si al introducir un comando no aparece un punto blanco despus de ejecutado el comando, significa que no se termino o no se ha terminado de ejecutar. A dems , siempre que aparezcan letras rojas significa que hay un error, la ayuda para el error la pueden encontrar pinchando r(198).
En resumen, para trabajar ordenadamente en STATA es conveniente cr ear una carpeta
para cada trabajo independiente, esta carpeta debe tener una ruta que no contenga
espacios en blanco en los nombres.
-
DEPARTAMENTO DE ECONOMA UNIVERSIDAD DE CHILE
8
III. Cmo cargar una base de datos?
Las bases de datos en formato Stata tienen extensin .dta. Las versione s antiguas del
software no se pueden abrir bases de datos que han sido trabajadas y guardas en una
versin ms moderna, cuando intentemos hacer esto el programa entregar un error
indicando que la base no tiene formato Stata.
Antes de abrir una base de da tos se tienen que cumplir dos condiciones :
1- El programa debe estar limpio, sin ninguna base de datos ya cargada.
Para limpiar el programa de otras bases de datos se debe utilizar el comando clear . Si he estado trabajando una base de datos previamente la
cual se ha modificado y no he guardado estas modificaciones, al intentar
abrir una nueva base de datos sin limpiar antes arrojar el siguiente error:
no; data in memory would be lost
2- El programa debe tener suficiente memoria . Para entregarle memoria a Stata se debe utilizar el comando set mem . Por ejemplo, si la base de datos
que deseamos cargar pesa 100 MB , en la ventana Stata Command
debemos tipear:
set mem 100m
Si Ud. no agrega me moria y los 10 MB que vienen asignados al abrir el
programa no son s uficientes, el programa arrojar el siguiente error :
no room to add more observations
Esto tambin puede suceder cuando se ha trabajado en la base de datos y
se han creado muchas vari ables : en un momento el programa se puede
quedar sin memoria . En este caso se debe limpiar el programa (borrar la base de datos) utilizando el comando clear ; entregarle ms memoria al
programa utilizando set mem ; abri r la base de datos y realizar todo
nuev amente. Por esta razn es fundamental que Ud. , cuando comience a
trabajar , asigne la memoria necesaria para todas las variables que espera
generar.
-
DEPARTAMENTO DE ECONOMA UNIVERSIDAD DE CHILE
9
El comando general para entregar memoria a Stata es:
set mem #[b|k|m|g] [, permanently]
con la opci
mantendr cada vez que se inicie nuevamente el programa.
Existen di stintas formas de cargar una base de datos:
1- Utilizando una base ya grabada con la extensin de STATA, es decir,
disponer de la base de datos como nombre .dta En este caso podemos
apretar el icono y buscar la ubicacin de la base de datos. Tambin
2- Otra forma es tipear en Stata Command use
guardaremos] \ [ruta de acceso] \ [ nombre de archivo.dta . Por
ejemplo:
use "C: \ Nivelacion_Stata \ exteps09 .dta", clear
o simplemente
use exteps09 .dta, clear
si ya le hemos indicado previamente a Stata que vamos a trabajar en la
carpeta Nivelacion_Stata del disco C.
N
garantiza que la base de datos sea abra si es que ya existe otra base de
datos previa en el programa, esta opcin ahorra el paso previo de ejecutar el comando clear antes de abri r la base de datos.
Recuerde que si la carpeta en la que est a trabajando tiene espacios en
blanco, debo poner comillas al llamar la base de datos, de lo contrario
aparecer el siguiente error:
-
DEPARTAMENTO DE ECONOMA UNIVERSIDAD DE CHILE
10
Esto porque Stata cree que el nombre de la carpeta es simp lemente
Nivelacion. Si utilizamos comillas no se produce el error.
Ahora si el nombre de la carpeta o el nombre de la base es ta mal ingresado
en el comando se produce el siguiente error:
3- Traspasar los datos de un archivo Excel o similar copiando la
informacin de este archivo al EDITOR de STATA.
Esto se hace copiando en el archivo Excel las columnas (variables) que
queremos traspasar com o base de datos a STATA (Ctr+C). L uego nos
dirigimos a STATA abrimos el EDITOR y pegamos la informacin
(Ctr+V). Obviamente antes de hacer esto se debe haber limpiado Stata con
el comando clear .
Algunos aspectos relevantes antes de copiar los datos de Excel a Stata:
Para Stata , como para cualquier otro software norteamericano, el
separador de miles es la coma (,) , y el separador de decimal es es el punto
(.); Si el computador en el que esta trabajando no esta configurado de esta
forma, debe dirigirse a inicio Panel de Control Opciones regionales, de
idioma, y de fecha y hora Configuracin regional y de idiom a Opciones
regionales, pichar personalizar, aqu se puede cambiar la configuracin
Todas las variables que son numricas, deben estar en formato
numrico antes de s er exportadas.
El siguiente cuadro muestra lo que resulta de pasar la base de datos
base.xls a Stata:
-
DEPARTAMENTO DE ECONOMA UNIVERSIDAD DE CHILE
11
El color rojo indica que la variable no es numrica.
Generalmente las bases de datos muy grandes no viene n en excel , ya que
este prog rama es limitad o en cuanto al n mero de filas (observaciones) y
nmero de columnas (variables). El nmero mximo de filas es de 65.536, y
el nmero mximo de columnas es de 256.
4- Otra forma de cargar bases de datos es mediante el comando insheet ,
este comando permite ca rgar bases de datos en formato ASCII (texto)
mediante el siguiente comando:
insheet using C: \ Nivelacion_Stata \ junio05 .txt
o alternativamente:
-
DEPARTAMENTO DE ECONOMA UNIVERSIDAD DE CHILE
12
-
DEPARTAMENTO DE ECONOMA UNIVERSIDAD DE CHILE
13
Cuando las bases de datos vienen el texto y son muy grandes no se pueden
ver utilizando un bl ock de notas, en estos casos se recomienda utilizar el
programa TextPad que puede ser descargado gratuitamente
(www.textpad.com ). Siempre es recomendable inspeccionar la base de
datos en texto antes de ser traspasada a Stata.
5- Si la base de datos tiene otro formato, por ejemplo, SPSS (.sav), dbase
(.dbf), Access (.mbd), etc; existe un software llamado Stat Transfer , que
permite transformar base de datos de sde y a diversos formatos.
Luego para guardar la base de d atos utilizamos el comando save :
1- Si quiere reescribir la base de datos antigua:
save C: \ Nivelacion_Stata \ ingresos.dta, replace
Es importante escribir replace , sino el programa les enviara un error
diciendo que la base de datos ya exis te.
2- Si quiere guardar la base de datos con un nuevo nombre no es
necesario tipear replace:
save C: \ Nivelacion_Stata \ ingresos_new .dta
Una vez que los datos han sido cargados, se puede optimizar el espacio que
estos ocupan utilizando el comando compress , este comando comprime la
base de datos. Es muy til cuando trabajamos con bases de datos grandes.
Hasta ahora hemos aprendido como cargar una base de datos en Stata, en lo que
sigue se vern los comandos bsicos para analizar una base de datos.
Entonces, con los comandos recin estudiados, c omencemos por abrir la base de
datos:
cd C: \ Nivelacion_Stata
set mem 100m
use exteps09 .dta, clear
http://www.textpad.com/ -
DEPARTAMENTO DE ECONOMA UNIVERSIDAD DE CHILE
14
IV. Leyendo los datos
Existen varios comandos que nos permiten obtener informacin preliminar acer ca de
de los datos y estadsticas acerca de ellos. Veremos bsicamente los comandos
describe , codebook, edit , sum, tab , inspect, count y duplicate.
Antes de ver detallamente cada uno de estos comandos descriptivos es necesario
aclarar que cada uno de ello s puede ser utilizado para ver el comportami ento de
grupos de observaciones mediante las opciones by e if . Por ejemplo: by sexo :
codebook , el cual nos mostrara la aplicacin del comando codebook separado para
cada sexo o codebook if sexo==1 , el cual nos mo strar la aplicacin del comando
codebook para el sexo que este codificado con el nmero 1.
Tambin podemos leer los datos usando las ventanas correspondientes, tal como lo
observamos en la siguiente figura:
Como podemos ver, si vamos a la opcin Da ta y luego seguimos la opcin Describe
data , veremos una serie de opciones que veremos a continuacin, tal como el
comando describe o el codebook . Tambin mediante la opcin Data podemos
directamente ver el editor de stata.
-
DEPARTAMENTO DE ECONOMA UNIVERSIDAD DE CHILE
15
IV.1. Describe
El co mando describe entrega informaci n de todas las variables que se encuentran en
la base de datos. Esta informacin incluye el tipo de almacenamiento (byte, int, long,
float, double, string) 4, el formato de los datos, la variable que contiene el label
(etiqueta), y la desc ripcin de la variable. Adems entrega informacin de nmero de
observaciones, nmero de variables y tamao de la base de datos.
Cuando la base de datos es muy grande y slo se quiere obtener informacin de algunas de las variables contenidas en ella, despus de describe (o simplemente d) se
ingresa la lista de variables de las cuales Ud. desea una descripcin.
Otras formas de utilizar el comando describe :
4 Ver Anexo A sobre el tipo de almacenamiento de datos
-
DEPARTAMENTO DE ECONOMA UNIVERSIDAD DE CHILE
16
Para usar el comando mediante el uso de ventanas basta con seguir el mismo
esquema reci n mostrado y hacer doble clic sobre D escribe variables in memory .
Luego se escribe el nombre de la variable de la cual quiero la descripcin y si quisiese,
por ejemplo, una descripcin especifica, puedo aplicar alguna de las opciones que se
observan en la ventana anterior.
-
DEPARTAMENTO DE ECONOMA UNIVERSIDAD DE CHILE
17
IV.2. Codebook
Existen otras formas de obtener una descripcin de las variables en la base de datos, una de las mejores es usar el comando codebook . Al igual que con el comando
describe , al tipear simplemente codebook se va a de scribir cada variable. El siguiente
cuadro muestra la diferencia entre ambos comandos:
Claramente el comando codebook es ms completo, presenta la etiqueta de la
variable, el formato, el rango de los datos, si esta codificada en nmeros enteros
(units: 1), cuantas observaciones no tienen dato de esta variable, el promedio, la
desviacin estndar, y los percentiles.
Tanto el comando describe como el comando codebook nos permite distinguir dos
tipos de variables, las numricas y las no numricas. Slo s e pueden obtener
estadsticas de los datos cuando las variables son numricas, aunque muchas veces es
ms fcil visualizar la base de datos cuando las variables tienen nombres en vez de
nmeros o cdigos.
Tambin podemos aplicar el comando va la utiliza cin de ventanas , lo que es similar al
caso d e describe, con la salvedad de que el doble click se hace sobre
contents
inspeccionar:
-
DEPARTAMENTO DE ECONOMA UNIVERSIDAD DE CHILE
18
Otra funcin que podemos aplicar sobre la misma ventana es condicionarla a algo,
como, por ejemplo, que la inspeccin sea slo para lo hombres:
-
DEPARTAMENTO DE ECONOMA UNIVERSIDAD DE CHILE
19
IV.3. Edit
Otra forma de conocer o tener una visin m s amplia de la base de datos es mediante
el comando edit ; el que no s mostrar una planilla donde po dremos ver la base de
datos completa; sus variables y todas sus observaciones . Tambin lo podemos hacer
Al igual que en los casos anteriores tambin se puede realizar la misma operacin va
el comando edit y tambin podemos editar una matriz mas pequea especificando las
variables que queramos incluir utilizando la encuesta casen 2003 edit sexo09 edad09 esc09 numper ytotal
-
DEPARTAMENTO DE ECONOMA UNIVERSIDAD DE CHILE
20
IV.4. ist; inspect; duplicates; count ; order
Un coman do bastante til, similar al edit; es el list; el cal despliega los datos en la
ventana de resultados (Stata Results); en vez de enviarnos al editor.
-
DEPARTAMENTO DE ECONOMA UNIVERSIDAD DE CHILE
21
Otro comando; el cual asegura que una variable es una codificacin nica dentro de una base de datos , es el comando duplicates report . Este comando se usa
generalmente para chequear que no existan observaciones duplicadas (folios
duplicados) dentro de una base de datos . Si tenemos la siguiente base de datos:
-
DEPARTAMENTO DE ECONOMA UNIVERSIDAD DE CHILE
22
El resultado que entrega aplicar este com
Finalmente, existen otros dos comandos interesantes para inspeccionar la base de
datos: inspect y count .
El comando inspect muestra la distribucin de la variable, la cantidad de
observaciones con valor cero, c on valores mayores a cero y sin dato, as como la
cantidad de nmero enteros y no enteros en la variable. Por ejemplo:
-
DEPARTAMENTO DE ECONOMA UNIVERSIDAD DE CHILE
23
El comando count , lo que hace es contar tal como lo dice su nombre. Por ejemplo:
Un comando adicional; que si bien no sirve para inspeccionar la base de datos, si no
ayuda a inspeccionarla; ya que nos permite ordenar las variables de la manera que ms nos acomode. Este comando es order el cual se utiliza de la siguiente manera:
order folio edad 09 esc 09 sexo 09
y nos entregar la base de datos de tal forma que al aplicar el comando edit la primera
variable que veremos ser folio, luego edad, luego aos de escolaridad, etc.
IV.5. Sum
El comando sum entrega estadsticas bsicas: nmero de observaciones, promedio,
desvia cin estndar, mnimo y mximo, de las variables que se especifiquen. Si slo se
escribe sum en Stata Command, se muestran las estadsticas de todas las variables en
la base de datos.
-
DEPARTAMENTO DE ECONOMA UNIVERSIDAD DE CHILE
24
Si nos interesan las estadsticas de una sola variable, por ejemplo , escolaridad:
Si requerimos las estadsticas de escolaridad, pero separado para hombres y mujeres,
primero se debe ordenar la base de datos por gnero ( sort dhombre) y luego hacer un
sum utilizando el comando by :
-
DEPARTAMENTO DE ECONOMA UNIVERSIDAD DE CHILE
25
Esto mismo se podra hacer al ternativamente utilizando if :
Si al comando sum le agregamos detail
cantidad ms amplia de estadsticas sobre la variables. Adems de las ya descritas
entrega los percentiles, la varianza, la asimetra y la kurtos is.
-
DEPARTAMENTO DE ECONOMA UNIVERSIDAD DE CHILE
26
Todo lo anterior se puede hacer tambin mediante ventanas, especificaremos s lo un
caso, donde se pide un sum de la variable esc y se pide una descripcin detallada, lo
que se obtiene mediante la opcin
-
DEPARTAMENTO DE ECONOMA UNIVERSIDAD DE CHILE
27
IV.6. Tabula te
El comando tabulate (o tab ) permite hacer tablas con las variables de inters. La
tabla ms sencilla se realiza de la siguiente forma:
Esta tabla indica el nmero de observaciones total y de cada una de las categoras de
la variable, el porcentaje que cada uno representa sobre el total y el porcentaje
acumulado.
El comando tab1 permite hacer esto mismo pero para varias variables
simultneamente:
-
DEPARTAMENTO DE ECONOMA UNIVERSIDAD DE CHILE
28
Adems, con este comando, se pueden realizar cruces entre variables, por ejemplo:
Si en vez de l as frecuencias uno quiere ver el porcentaje, que sume 100% en forma
horizontal (filas), se debe agregar a lo anterior una coma y la palabra row y poner
adems nofreq (para que no se muestre las frecuencias):
-
DEPARTAMENTO DE ECONOMA UNIVERSIDAD DE CHILE
29
Si se quiere que los porcentajes sumen 100% en forma vertical (columnas) debemos
hacer lo siguiente:
Si deseamos que se muestren ambos porcentajes:
tab esc 09 sexo09 , col row nofreq
Tambin se pueden hacer tablas utilizando el comando by , primero ordenando de
acuerdo a la variable que voy a re alizar las tablas, por ejemplo:
by s sexo09 : tab esc 09
Este cdigo entrega dos tablas de la variable escolaridad, una para los hombres y otra
para las mujeres. Lo mismo es posible de ser realizado utilizando el condicional if :
tab esc 09 if sexo09== 1
t ab esc09 if sexo09==2
-
DEPARTAMENTO DE ECONOMA UNIVERSIDAD DE CHILE
30
Tambin se puede utilizar el comando tabulate para generar variables dicotmicas.
Por ejemplo, si se quiere generar variables dicotmicas para cada ao de escolaridad:
nosi
educacindeaostienesiesc
nosi
educacindeaostienesiesc
0
112
0
011
Se puede hacer de la siguiente for ma:
tab esc 09, generate( Desc _)
Si los aos de educacin toman valores que van desde 0 a 21, se generarn 22
variables dicotmicas.
Supngase ahora que se requiere hacer un cuadro con los aos de escolaridad, pero en
vez de entregar la frecuencia o po rcentaje de observaciones en cada categora, se
requiere que muestre una estadstica de otra variable, por ejemplo, el promedio de ingreso. Para realizar este tipo de tablas se debe usar el comando tab agregndole
despus de una coma la palabra summarize . Para el ejemplo citado debera utilizar el
siguiente cdigo: