Post on 14-Apr-2018
7/29/2019 Guia de Stata 2
1/37
Bioestadstica
Gua para el Alumno
Stata 8.0
7/29/2019 Guia de Stata 2
2/37
Bioestadstica
SEMANA I - ASPECTOS GENERALES
I. Introduccin y manejo bsico de Stata
A. Elementos bsicos (obtener ayuda, salir)
Stata 8 presenta formato de mens como de ventanas, estas cuatro ventanas llamadasReview, Variables, Stata Results y Stata command. Si maneja Stata 8 con comandos, estos se
tipean en la ventana Stata command, y los resultados aparecen en la ventana Stata Results. La
ventanaReview registra comandos utilizados previamente, los cuales pueden ser reenviados a
la ventana de Stata commandclickeando sobre ellos. Para obtenerayuda, clickee en el men
Reviewacumula comandos anteriores, loscuales pueden ser reenviados a la ventanade Stata commandclickeando sobre ellos
Variables, presenta las variablesde base de datos en uso.
Stata Result, muestra los corridas de
aplicar comandos en Stata
Stata se maneja con comandos, los cuales
se tipean en la ventanaStata command
7/29/2019 Guia de Stata 2
3/37
Bioestadstica
la opcion Help y siga las instrucciones en pantalla. Para terminar la sesin, cierre el programaclickeando en el botn superior derecho (como cualquier otro programa Windows).
El programa Stata 8 nos presenta una variedad de iconos, que pueden agilizar el
manejo y anlisis de una base de datos.
Para abrir un archivo, use.
Para guardar archivo que se encuentra en memoria, save
Para poder imprimir un archivo, print
Para crear un archivo que guarde bitcoras del Stata Results, log
Para crear un archivo que guarde programas de ventanaReview, do
Para abrir ventana de edicin de base de datos, edit
Para visualizar base de datos en uso, browse
COMANDO DESCRIPCION
help Ayuda de programa stata, para comandos.log Uso de archivos de bitcora
use Abrir una base de datos en stata (extensin .dta)edit Ingreso de datos por medio de ventana de Stata Editorcodebook Muestra variables con estadsticos descriptivosdescribe Describe contenido de datos en memoria o sobre el disco
Copiar y pegar datos de MS Excel
save Guarda los datos en disco con extensin *.dtalist Lista de valores de variable
... if ...Selecciona observaciones cumpliendo cierta condicion para laejecucion del comando
drop Borrar variable o dato en memoria
keep Borra variables o datos no seleccionadoslabel variable Comando de etiqueta de variableslabel define Primer paso para etiquetar valores de una variablelabel values Segundo paso para etiquetar valores de una variable
Demostracin y explicacin de los comandos de Stata
En Stata la sintaxis de los comandos es la siguiente:
7/29/2019 Guia de Stata 2
4/37
Bioestadstica
comandolista de variables [ifexpression] [inexpression], [opciones]
help. Para obtener ayuda de parte del programa stata 8
Para opciones generales del comando
. help
Para ayuda sobre contenido general del uso en stata
. help contents
Para ayuda sobre el comando list
. help list
log. El siguiente comando nos permite guardar las bitcoras realizadas en el analisis dedatos, en un archivo con la extensin mas adecuada para el usuario.
. log using "C:\DATA\clase1.txt", text
---------------------------------------------------------------------------------------
log: C:\DATA\clase1.txt
log type: text
opened on: 2 Jun 2003, 13:22:48
use
Para el uso de la base de datos cancer.dat, escribiremos el comando use, usando ademas la opcinclear, que nos permite cargar la base de datos en memoria aun teniando en uso otra base de datosy guardando los cambio cargados en memoria realizados en esta ultima
use "C:\Stata\cancer.dta", clear(Patient Survival in Drug Trial)
edit
Para ingresar los datos por medio de una ventana tipo hoja de calculo utilizamos el comando edit,
el cual apertura una ventana de ingreso de datos
editAl terminar de ingresardatos haga click en el icono
preserve para no perder el
ingreso de datos realizado
7/29/2019 Guia de Stata 2
5/37
Bioestadstica
codebookEste comando muestra una lista de las variables sealando el tipo de variable, su rango,
frecuencias en caso de una variable cualitativa (codificada) media, desviacin estandar y
percentiles en caso fuera una variable continua.
Use C:\Stata8\auto.dta, clearcodebookuse "C:\Stata8\auto.dta", clearmpg Mileage (mpg)---------------------------------------------------------------------------------------
type: numeric (int)range: [12,41] units: 1
unique values: 21 missing .: 0/74mean: 21.2973
std. dev: 5.7855percentiles: 10% 25% 50% 75% 90%
14 18 20 25 29
rep78 Repair Record 1978---------------------------------------------------------------------------------------
type: numeric (int)range: [1,5] units: 1
unique values: 5 missing .: 5/74tabulation: Freq. Value
2 18 2
30 318 411 5
describeEste comando muestra una lista de las variables de la base de datos en uso.
. describe
Contains data from miarchi.dta
obs: 3
vars: 3 5 Nov 2002 12:35
7/29/2019 Guia de Stata 2
6/37
Bioestadstica
size: 102 (99.9% of memory free)
-------------------------------------------------------------------------------
storage display value
variable name type format label variable label
-------------------------------------------------------------------------------
name str20 %20s
age float %9.0g
sex str6 %9s
-------------------------------------------------------------------------------
Sorted by:
Copiar de una hoja excel datos a Stata 8
El programa Stata 8 tiene la facilidad de copiar los datos de una hoja de excell con simplesopciones de copiar y pegar que se utilizan en windows, antes teniendo la ventana de edit activada
en Stata 8.
1. Edit, stata82. Cambio de ventana a excell
3. Seleccionar datos a ser copiados y hacer clic en icono de copiar, ctrl. + C4. cambiar de ventana edit de Stata 85. Hacer clic en icono de pegar, ctrl + V
savePara guardar datos que se han ingresado
save miarchi
7/29/2019 Guia de Stata 2
7/37
Bioestadstica
Si no se muestra el directorio donde estara el archivo, por defecto se guarda el archivo en el
directorio C:\Data. Si el archivo ya habia sido creado anteriormente y se han ingresado datosnuevamente se utiliza la opcion replace
save miarchi, replace
list. Presenta los valores de las variables. Si no presenta variables con el comando list, sepresentaran los valores de todas las variables
use "C:\Stata\auto.dta", clear
list drug age
drug age
1. 1 39
2. 1 66
3. 1 704. 1 44
5. ... ...
6. ... ...7. ... ...
ifal final de un orden significa usar slo los datos especificados. ifes permitido con la mayorade los comandos de Stata.
list drug age if age > 45
drug age
2. 1 66
3. 1 709. 1 48
11. 1 63
14. 1 64
drop. Borra variables valores seleccionados.
drop variable
De inmediato desaparece de ventana de variables en memoria
keep. Borra variables o valores no seleccionados.
keep variable
label, sirve para etiquetar datos, variables y valores.
7/29/2019 Guia de Stata 2
8/37
Bioestadstica
label variable age "edad del paciente"
describe agestorage display value
variable name type format label variable label
-------------------------------------------------------------------------------age int %8.0g edad del paciente
label define. Es utilizado como un primer paso para el etiquetar valores de variables seleccionada
label define drogas 1 Megacilina 2 Tetracicilna 3 Oxacilina 4 Penicilina
label values. Es utilizado como segundo paso para el etiquetar valores de variables seleccionada
label values drug drogas
7/29/2019 Guia de Stata 2
9/37
Bioestadstica
Exploracin y presentacin de datos.
generate Genera variablereplace Reemplaza valores de variable bajo alguna condicinmerge Ingresa variables o casos de una base patrn a otra
collapse Calculo de estadsticos descriptivos para variables cuantitativassummarize Anlisis para variable cuantitativa, media, mediana, etctabulate Tabla de frecuencias para variables cualitativastable Tabla de frecuencias simples para variables cualitativasgraph Crea un grafico de cualquier variablescatter Genera grafico de dispersin entre 2 variablesboxplots Grafico de cajasbar Grafico de barraslines Grafico de lineasstacked bar Grafico de barras apiladas
meanGrabar y editar review.
Uso del editor de programas (archivo .do)
Variables:
Variables Cuantitativas
o Variable Discretas
o Variable continuas
Variables Cualitativas
o Variable nominal
o Variable ordinal
Demostracin y explicacin
Definicin de tipos de datos, presentacin de datos en tablas de contingencia y resumen,
presentaciones grficas diversas. Estadstica descriptiva simple: medidas de tendencia central y
dispersin. Uso de archivos de bitcora (log),
1. Para el analisis de las variables numericas tenemos el comando summarize, el cual calculaestadisticos de tendencia central, asi como de distribucion.
Entonces trabajando con el archivo de c:\stata\cancer.dta, tenemos
generate. Genera una variable que va a ser recodificada , por ejemplo si tenemos en uso elarchivo cancer (c:\stata\cancer.dta) y queremos recodificar la variable age en una nueva variable
age1 que contenga los intervalos de edad 45-50 51-55 56-60 61a+. Entonces seguimos lospasos correspondientes para el ejemplo
7/29/2019 Guia de Stata 2
10/37
Bioestadstica
Para abrir el archivo canceruse c:\stata\cancer.dta, clear
Generando la variable age1 con valores iguales a age
generate age1 = age
Para reemplazar valores en la nueva variable age1, utilizamos el comando replace, if yoperadores logicos y de relacion
replace age1 = 0 if age 50 & age 55 & age 60
. replace age1 = 0 if age 50 & age 55 & age 60(11 real changes made)
summarize. El presente comando es una opcin para obtener estadsticosdescriptivos para variables cuantitativas.
. summarize age
Variable | Obs Mean Std. Dev. Min Max-------------+-----------------------------------------------------
age | 48 55.875 5.659205 47 67
. summarize studytime age
Variable | Obs Mean Std. Dev. Min Max-------------+-----------------------------------------------------studytime | 48 15.5 10.25629 1 39
age | 48 55.875 5.659205 47 67
. summarize age, detail
Patient's age at start of exp.
-------------------------------------------------------------
Percentiles Smallest
1% 47 47
5% 48 48
7/29/2019 Guia de Stata 2
11/37
Bioestadstica
10% 49 48 Obs 48
25% 50.5 49 Sum of Wgt. 48
50% 56 Mean 55.875
Largest Std. Dev. 5.659205
75% 60 65
90% 65 67 Variance 32.0266
95% 67 67 Skewness .316106699% 67 67 Kurtosis 2.125197
Para generar estadsticos para una determinada variable cuantitativa, necesitamos colocar losestadisticos sobre un parentecis
merge. El comando nos ayuda a unir informacin entre bases de datos relacionadas.
Ejemplo: uno a uno merge
. use ds1
. merge using ds2
collapse. Reporta estadsticas sobre tendencia central.
El siguiente ejercicio muestra como se podra solicitar las estadsticas descriptivas.
collapse (mean) age (median) systolic, by (drug)
tabulate. Para trabajar variables cualitativas como factores, sexo, grupos de edad, etc
. tabulate drug
Drug type |
(1=placebo) | Freq. Percent Cum.
------------+-----------------------------------
1 | 20 41.67 41.67
2 | 14 29.17 70.83
3 | 14 29.17 100.00
------------+-----------------------------------
Total | 48 100.00
Freq, representa al numero pacientes por tipo de droga que se recet, percent, el porcentaje depacientes que fue tratado por algn tipo de droga. Cum., el porcentaje acumulado.
tabulate died, summarize( age)
1 if | Summary of Patient's age at start
patient | of exp.
7/29/2019 Guia de Stata 2
12/37
Bioestadstica
died | Mean Std. Dev. Freq.
------------+------------------------------------
0 | 54.176471 5.4340971 17
1 | 56.806452 5.6475325 31
------------+------------------------------------
Total | 55.875 5.6592045 48
Table. Este comando calcula frecuencias simple, adems puede calcular otros estadsticosealados por el usuario, utilizando la opcin contents
. table drug, contents (mean age)
----------------------
Drug Used | mean(age)
----------+-----------
1 | 46.6
2 | 45.6667
3 | 46.6667
4 | 42.1875----------------------
Para poder realizar grficos tenemos el comando graph, y sus diferentes variedades segn el tipode grfico que se quiere realizar.
Histograma
Ejemplo:
histogram age
Fraction
Patient's age at start of exp.47 67
0
.3125
Automticamente el programa Stata8 divide el grafico en 5 barras, depende del usuario el numero
de intervalos que se desean obtener, esto utilizando la opcin bi {graph age, bi(7) }.
Grafico de dispersin
scatter studytime age
7/29/2019 Guia de Stata 2
13/37
Bioestadstica
Grafico de cajas
graph box age, over(drug)
Monthstodeathorendofexp.
Patient's age at start of exp.47 67
1
39
47
67
Patient's age at start of exp.
1 2 3
7/29/2019 Guia de Stata 2
14/37
Bioestadstica
Grafico de Linea
line birthrt year
do.Archivo donde se archivan los programas ejecutados en sesin de Stata, para ello debemos hacerclic en la parte superior derecha de la ventana de Review y hacer clic en la opcin Save Review
Contents.
livebirthsper1000women
year194019431946194919521955195819611964196719701973197619791982198519881991
6.60003
45.1002
7/29/2019 Guia de Stata 2
15/37
Bioestadstica
SEMANA II DESCRIPCIN DE DATOSBases de Datos
Inteligencia.dta
Base de datos referida a investigacin sobre la relacin entre la desnutricin crnica (talla para la
edad) y rendimiento intelectual del menor
Para observar que tipo de variables se trabajan en esta base de datos utilizaremos el comando
coodebok
use "C:\inteligencia.dta", clear
. codebook
sex Sex 0=F 1=M
------------------------------------------------------------------------------type: numeric (byte)
range: [0,1] units: 1unique values: 2 missing .: 0/143
------------------------------------------------------------------------------tester Psych Tester------------------------------------------------------------------------------
range: [1,6] units: 1unique values: 6 missing .: 0/143
------------------------------------------------------------------------------wtotal WISC Total------------------------------------------------------------------------------
range: [55,128] units: 1unique values: 49 missing .: 0/143
------------------------------------------------------------------------------grade_n GRADE LEVEL NUMERIC------------------------------------------------------------------------------
range: [2,5] units: 1unique values: 4 missing .: 3/143
------------------------------------------------------------------------------haz1999 Height-for-age Z-score 1999------------------------------------------------------------------------------
range: [-3.48,1.17] units: .01unique values: 114 missing .: 0/143
------------------------------------------------------------------------------edutype SCHOOL TYPE 1=PUBLIC 2=PRIVATE 3=ATTENDED BOTH------------------------------------------------------------------------------
range: [1,3] units: 1unique values: 3 missing .: 2/143
------------------------------------------------------------------------------eduback EVER BEEN HELD BACK IN SCHOOL 1=YES 2=NO------------------------------------------------------------------------------
range: [1,2] units: 1unique values: 2 missing .: 2/143
7/29/2019 Guia de Stata 2
16/37
Bioestadstica
------------------------------------------------------------------------------momedu MATERNAL EDUCATION 1=NONE 2=PI 3=PC 4=SI 5=SC 6=SUPERIOR 7=TECHNICAL------------------------------------------------------------------------------
range: [1,7] units: 1unique values: 7 missing .: 2/143
------------------------------------------------------------------------------dadedu PATERNAL EDUCATION 0=UNKNOWN 2=PI 3=PC 4=SI 5=SC 6=SUPERIOR 7=TECHNICAL
------------------------------------------------------------------------------range: [0,7] units: 1
unique values: 7 missing .: 2/143
Malaria.dta
Base de datos con el objetivo de determinar cuales con los factores de riesgoque condicionan la no adherencia a tratamiento antimalarico
. use "C:\Marco C\stata_group\curso de stata\bses\malaria.dta", clear
. codebook
------------------------------------------------------------------------------edad Edad del paciente------------------------------------------------------------------------------
range: [9,80] units: 1unique values: 49 missing .: 0/125
------------------------------------------------------------------------------personal Personal de salud que atendio al paciente------------------------------------------------------------------------------
range: [1,5] units: 1unique values: 4 missing .: 1/125
tabulation: Freq. Numeric Label1 1 practicante62 3 tcnico de enfermeria43 4 enfermera18 5 mdico1 .
------------------------------------------------------------------------------malapf Ha tenido anteriormente malaria por Plasmodium falciparum?------------------------------------------------------------------------------
range: [1,3] units: 1unique values: 3 missing .: 0/125
tabulation: Freq. Numeric Label46 1 Si65 2 No14 3 no tuvo malaria
------------------------------------------------------------------------------
dos_qkg Dosis de quinina segun kg------------------------------------------------------------------------------
range: [0,2] units: 1unique values: 3 missing .: 1/125
tabulation: Freq. Numeric Label3 0 Subdosis
106 1 Correcto15 2 Sobredosis1 .
7/29/2019 Guia de Stata 2
17/37
Bioestadstica
------------------------------------------------------------------------------dos_tkg Dosis de Tetraciclina segun kg------------------------------------------------------------------------------
range: [0,2] units: 1unique values: 3 missing .: 1/125
tabulation: Freq. Numeric Label4 0 Subdosis
115 1 Correcto5 2 Sobredosis1 .
------------------------------------------------------------------------------cumfinal Cumplimiento de toma de pastillas en
todo el periodo de tratamiento------------------------------------------------------------------------------
range: [1,2] units: 1unique values: 2 missing .: 0/125
tabulation: Freq. Numeric Label90 1 Cumplio35 2 No cumplio
------------------------------------------------------------------------------
eess (unlabeled)------------------------------------------------------------------------------
range: [1,4] units: 1unique values: 4 missing .: 0/125
Neumona.dta
. use "C:\Neumonia.dta", clear
. codebook
------------------------------------------------------------------------------tipo caso------------------------------------------------------------------------------
range: [0,1] units: 1unique values: 2 missing .: 0/193
tabulation: Freq. Numeric Label128 0 control65 1 caso
------------------------------------------------------------------------------edad2 edad------------------------------------------------------------------------------
range: [0,2] units: 1unique values: 3 missing .: 0/193
tabulation: Freq. Numeric Label73 0 mayor 1 ao94 1 2 a 11 meses26 2 menor 2 meses
------------------------------------------------------------------------------desnutri desnutrici------------------------------------------------------------------------------
range: [0,1] units: 1unique values: 2 missing .: 2/193
7/29/2019 Guia de Stata 2
18/37
Bioestadstica
tabulation: Freq. Numeric Label177 0 no14 1 si2 .
------------------------------------------------------------------------------antibio1 recibio tto antibitico------------------------------------------------------------------------------
range: [0,1] units: 1unique values: 2 missing .: 0/193
tabulation: Freq. Numeric Label139 0 si54 1 no
------------------------------------------------------------------------------hospital (unlabeled)------------------------------------------------------------------------------
range: [0,1] units: 1unique values: 2 missing .: 0/193
tabulation: Freq. Numeric Label91 0 si102 1 no
------------------------------------------------------------------------------estable1 fue llevado a establecimiento salud------------------------------------------------------------------------------
range: [0,1] units: 1unique values: 2 missing .: 0/193
tabulation: Freq. Numeric Label146 0 si47 1 no
------------------------------------------------------------------------------completo (unlabeled)------------------------------------------------------------------------------
range: [0,1] units: 1unique values: 2 missing .: 11/193
tabulation: Freq. Numeric Label124 0 si58 1 no11 .
------------------------------------------------------------------------------fajaba (unlabeled)------------------------------------------------------------------------------
range: [0,1] units: 1unique values: 2 missing .: 1/193
tabulation: Freq. Numeric Label40 0 no152 1 si1 .
------------------------------------------------------------------------------
pesonuev (unlabeled)------------------------------------------------------------------------------
range: [0,1] units: 1unique values: 2 missing .: 0/193
tabulation: Freq. Numeric Label173 0 no bajo peso al nacer20 1 bajo peso al nacer
7/29/2019 Guia de Stata 2
19/37
Bioestadstica
Tabaco.dta
. use "C:\tabaco.dta", clear
. codebook
------------------------------------------------------------------------------id_regregines------------------------------------------------------------------------------
range: [1,4] units: 1unique values: 4 missing .: 0/2458
tabulation: Freq. Numeric Label584 1 lima metropolitana693 2 resto costa624 3 sierra557 4 selva
------------------------------------------------------------------------------
inf_sexo inf_sexo------------------------------------------------------------------------------
range: [1,2] units: 1unique values: 2 missing .: 0/2458
tabulation: Freq. Value1061 11397 2
------------------------------------------------------------------------------inf_edad inf_edad------------------------------------------------------------------------------
range: [12,64] units: 1unique values: 53 missing .: 0/2458
------------------------------------------------------------------------------p35 cul es el nivel de educacin alcanzado por ud.?------------------------------------------------------------------------------
range: [1,10] units: 1
unique values: 10 missing .: 0/2458examples: 5 secundaria incompleta
5 secundaria incompleta6 secundaria completa8 superior no universitario completa
------------------------------------------------------------------------------p47_a siente ud. qu puede contar con su familia cuando tiene
dificultades o preocupa------------------------------------------------------------------------------
range: [1,88] units: 1unique values: 5 missing .: 0/2458
tabulation: Freq. Numeric Label177 1 no487 2 a veces440 3 casi siempre
1348 4 siempre6 88 no sabe
7/29/2019 Guia de Stata 2
20/37
Bioestadstica
------------------------------------------------------------------------------p47_b se rene con su familia para conversar sobre logros
personales y familiares?------------------------------------------------------------------------------
range: [1,88] units: 1
unique values: 5 missing .: 0/2458tabulation: Freq. Numeric Label
251 1 no652 2 a veces488 3 casi siempre
1058 4 siempre9 88 no sabe
------------------------------------------------------------------------------p47_c se rene con su familia para conversar sobre dificultades
personales y familiar------------------------------------------------------------------------------
range: [1,88] units: 1unique values: 5 missing .: 0/2458
tabulation: Freq. Numeric Label295 1 no697 2 a veces488 3 casi siempre966 4 siempre12 88 no sabe
------------------------------------------------------------------------------p47_d su familia discute violentamente, es decir, con agresiones verbales?------------------------------------------------------------------------------
range: [1,88] units: 1unique values: 5 missing .: 0/2458
tabulation: Freq. Numeric Label1581 1 no725 2 a veces69 3 casi siempre77 4 siempre6 88 no sabe
------------------------------------------------------------------------------p47_e las decisiones importantes se toman en conjunto aqu en casa?------------------------------------------------------------------------------
range: [1,88] units: 1unique values: 5 missing .: 0/2458
tabulation: Freq. Numeric Label288 1 no406 2 a veces550 3 casi siempre
1201 4 siempre
13 88 no sabe------------------------------------------------------------------------------p47_f al momento de tomar decisiones importantes, su familia toma encuenta sus opini------------------------------------------------------------------------------
range: [1,88] units: 1unique values: 5 missing .: 0/2458
tabulation: Freq. Numeric Label225 1 no487 2 a veces
7/29/2019 Guia de Stata 2
21/37
Bioestadstica
477 3 casi siempre1263 4 siempre
6 88 no sabe------------------------------------------------------------------------------p47_g su familia muestra inters por sus sentimientos y afectos?------------------------------------------------------------------------------
range: [1,88] units: 1
unique values: 5 missing .: 0/2458tabulation: Freq. Numeric Label
179 1 no297 2 a veces421 3 casi siempre
1541 4 siempre20 88 no sabe
------------------------------------------------------------------------------p47_h siente que su familia lo/la quiere?------------------------------------------------------------------------------
range: [1,88] units: 1unique values: 5 missing .: 0/2458
tabulation: Freq. Numeric Label
119 1 no131 2 a veces242 3 casi siempre
1950 4 siempre16 88 no sabe
------------------------------------------------------------------------------p47_i se renen en familia para compartir momentos juntos por lo menos
una vez por se------------------------------------------------------------------------------
range: [1,88] units: 1unique values: 5 missing .: 0/2458
tabulation: Freq. Numeric Label240 1 no610 2 a veces485 3 casi siempre
1114 4 siempre9 88 no sabe
------------------------------------------------------------------------------p58 cundo fue la primera vez que ud. Fum cigarrillos?------------------------------------------------------------------------------
range: [1,4] units: 1unique values: 4 missing .: 0/2458
tabulation: Freq. Numeric Label19 1 durante los ltimos 30 das61 2 hace ms de un mes pero menos de
un ao1576 3 hace ms de un ao
802 4 nunca ha fumado------------------------------------------------------------------------------p59 qu edad tena ud. cuando fum cigarrillos por primera vez?------------------------------------------------------------------------------
range: [6,88] units: 1unique values: 43 missing .: 802/2458
examples: 161825.
7/29/2019 Guia de Stata 2
22/37
Bioestadstica
------------------------------------------------------------------------------p85 en su grupo de amigos ms cercanos, con qu frecuencia toman bebidas
alcohlica------------------------------------------------------------------------------
range: [1,9] units: 1
unique values: 9 missing .: 1/2458tabulation: Freq. Numeric Label
18 1 todos los das501 2 los fines de semana112 3 algunos das de la semana79 4 los fines de semana198 5 algunas veces al mes
1124 6 solo en ocaciones especiales4 7 otro
392 8 no toman bebidas alcohlicas29 9 no tiene amigos1 .
------------------------------------------------------------------------------
p86 de acuerdo a lo que ud. conoce en su barrio, cmo es el consumo debebidas alco
------------------------------------------------------------------------------range: [1,88] units: 1
unique values: 5 missing .: 0/2458tabulation: Freq. Numeric Label
642 1 intenso1135 2 moderado548 3 leve35 4 no consumen98 88 no sabe
------------------------------------------------------------------------------p87 cundo fue la primera vez que ud. Tom bebidas alcohlicas?------------------------------------------------------------------------------
range: [1,4] units: 1unique values: 4 missing .: 0/2458
tabulation: Freq. Numeric Label27 1 durante los ltimos 30 das78 2 hace ms de un mes pero menos de
un ao2207 3 hace ms de un ao146 4 nunca ha consumido bebidas
alcohlicas------------------------------------------------------------------------------p88 la primera vez que ud. tom bebidas
alcohlicas qu tipo de bebida tom?------------------------------------------------------------------------------
range: [1,88] units: 1unique values: 11 missing .: 146/2458
examples: 1 cerveza malta1 cerveza malta4 vino / sangra7 otro
7/29/2019 Guia de Stata 2
23/37
Bioestadstica
------------------------------------------------------------------------------p89 qu edad tena ud., cuando tom por primera vez (bebida alcohlicacirculada e------------------------------------------------------------------------------
range: [1,88] units: 1
unique values: 47 missing .: 146/2458examples: 14
161821
------------------------------------------------------------------------------p90 con quin estaba ud. la primera vez que tom (bebida alcoholica
circulada en------------------------------------------------------------------------------
range: [1,88] units: 1unique values: 12 missing .: 146/2458
examples: 3 con compaeros de trabajo4 con otro grupo de amigos
7 con sus padres y hermanos8 con otros familiares
------------------------------------------------------------------------------p91 qu lo motivo a tomar (bebida
alcoholica circulada en p-88)...por prime
------------------------------------------------------------------------------range: [1,88] units: 1
unique values: 15 missing .: 146/2458examples: 3 para pasarla bien / estar en onda
5 curiosidad5 curiosidad11 por querer esperimentar nuevas sensaciones
------------------------------------------------------------------------------p92 y, cundo fue la ltima vez que tom
alguna bebida alcohlica?------------------------------------------------------------------------------
range: [1,3] units: 1unique values: 3 missing .: 146/2458
tabulation: Freq. Numeric Label953 1 durante los ltimos 30 das852 2 hace ms de un mes pero menos de
un ao507 3 hace ms de un ao146 .
------------------------------------------------------------------------------fac_1_po factor de expansin
------------------------------------------------------------------------------range: [28.806734,23127.695] units: 1.000e-06
unique values: 539 missing .: 0/2458
7/29/2019 Guia de Stata 2
24/37
Bioestadstica
Estadstica descriptiva intermedia.
generate * Genera variable
replace * Reemplaza valores de variable bajo alguna condicintabulate * Tabla de frecuencias para variables cualitativastable * Tabla de frecuencias simples para variables cualitativastab1 Produce una tabla de frecuencia para cada variable en varlisttab2 Produce todas los posibles cruces de variable de los varlisttabsum Produce tablas de estadsticas descriptivas en una dos vassummarize * Anlisis para variable cuantitativa, media, mediana, etcmeans Reporta la media aritmtica, geomtrica y armnicacentile Calcula los centiles de varlist especificados por la list en centile( )ci Calcula el error estndar e intervalos de confianza de los varlist
cii Es la forma inmediata de cistem Grafico de tallos y hojas
qqplotPlano de quintiles de variable1 en contraste con los quintiles devariable2
graph (*) Crea un grafico de cualquier variableplot Produce un grafico de dispersin entre dos variablescompare Realiza un conteo de las diferencia y similitudes entre la var1 y var2inspect Proporciona un resumen rpido de una variable numrica(*) Comando que se uso en anterior clase
tab1
Ejemplo: Se desea generar una tabla de frecuencias para las variables sex eduback dadedu
use "C:\inteligencia.dta", cleartab1 sex eduback dadedu
-> tabulation of sex
Sex 0=F 1=M | Freq. Percent Cum.------------+-----------------------------------
0 | 67 46.85 46.851 | 76 53.15 100.00
------------+-----------------------------------Total | 143 100.00
-> tabulation of eduback
EVER BEEN |HELD BACK |
7/29/2019 Guia de Stata 2
25/37
Bioestadstica
IN SCHOOL |1=YES 2=NO | Freq. Percent Cum.------------+-----------------------------------
1 | 34 24.11 24.112 | 107 75.89 100.00
------------+-----------------------------------Total | 141 100.00
-> tabulation of dadedu
PATERNAL |EDUCATION |0=UNKNOWN |2=PI 3=PC |4=SI 5=SC |6=SUPERIOR |7=TECHNICAL | Freq. Percent Cum.------------+-----------------------------------
0 | 6 4.26 4.262 | 8 5.67 9.93
3 | 18 12.77 22.704 | 18 12.77 35.465 | 72 51.06 86.526 | 8 5.67 92.207 | 11 7.80 100.00
------------+-----------------------------------Total | 141 100.00
tab2
Ejemplo: Se desea obtener todos los posibles cruces entre las variables sex eduback dadedu
. tab2 sex eduback dadedu
-> tabulation of sex by eduback
| EVER BEEN HELD BACKSex 0=F | IN SCHOOL 1=YES 2=NO
1=M | 1 2 | Total-----------+----------------------+----------
0 | 16 50 | 661 | 18 57 | 75
-----------+----------------------+----------
Total | 34 107 | 141
-> tabulation of sex by dadedu
| PATERNAL EDUCATION 0=UNKNOWN 2=PI 3=PC 4=SI 5=SCSex 0=F | 6=SUPERIOR 7=TECHNICAL
7/29/2019 Guia de Stata 2
26/37
Bioestadstica
1=M | 0 2 3 4 5 | Total-----------+-------------------------------------------------------+----------
0 | 2 4 12 6 33 | 661 | 4 4 6 12 39 | 75
-----------+-------------------------------------------------------+----------Total | 6 8 18 18 72 | 141
| PATERNAL EDUCATION| 0=UNKNOWN 2=PI 3=PC| 4=SI 5=SC 6=SUPERIOR
Sex 0=F | 7=TECHNICAL1=M | 6 7 | Total
-----------+----------------------+----------0 | 3 6 | 661 | 5 5 | 75
-----------+----------------------+----------Total | 8 11 | 141
-> tabulation of eduback by dadedu
EVER BEEN |HELD BACK | PATERNAL EDUCATION 0=UNKNOWN 2=PI 3=PC 4=SI 5=SCIN SCHOOL | 6=SUPERIOR 7=TECHNICAL1=YES 2=NO | 0 2 3 4 5 | Total-----------+-------------------------------------------------------+----------
1 | 0 2 4 8 16 | 342 | 6 6 14 10 56 | 107
-----------+-------------------------------------------------------+----------Total | 6 8 18 18 72 | 141
| PATERNAL EDUCATIONEVER BEEN | 0=UNKNOWN 2=PI 3=PCHELD BACK | 4=SI 5=SC 6=SUPERIORIN SCHOOL | 7=TECHNICAL1=YES 2=NO | 6 7 | Total-----------+----------------------+----------
1 | 0 4 | 342 | 8 7 | 107
-----------+----------------------+----------Total | 8 11 | 141
tabsum
Ejemplo: Se desea conocer las estadsticas descriptivas de la variable haz1999 por genero
7/29/2019 Guia de Stata 2
27/37
Bioestadstica
use "C:\inteligencia.dta", cleartabulate sex, summarize(haz1999)
| Summary of Height-for-age Z-score| 1999
Sex 0=F 1=M | Mean Std. Dev. Freq.------------+------------------------------------
0 | -1.318209 .76393306 671 | -1.0518421 .91865512 76
------------+------------------------------------Total | -1.1766434 .85719075 143
Ejemplo: Se desea conocer las estadsticas descriptivas de la variable haz1999por genero y tipo de escuela
. tabulate sex eduback, summarize(haz1999)
Means, Standard Deviations and Frequencies of Height-for-age Z-score 1999
| EVER BEEN HELD BACK| IN SCHOOL 1=YES
Sex 0=F | 2=NO1=M | 1 2 | Total
-----------+----------------------+----------0 | -1.320625 -1.2946 |-1.3009091| .90374383 .7133457 | .75644661| 16 50 | 66
-----------+----------------------+----------1 |-1.0472222 -1.0389474 |-1.0409333| .93760524 .9226373 | .91987245| 18 57 | 75
-----------+----------------------+----------Total |-1.1758824 -1.1584112 |-1.1626241
| .91831901 .83748067 | .85432818| 34 107 | 141
means
Ejemplo: Se desea obtener las medias aritmetica, geometrica y armonica de la variable haz1999
. use "C:\inteligencia.dta", clear
. means haz1999 sex
Variable | Type Obs Mean [95% Conf. Interval]
-------------+----------------------------------------------------------haz1999 | Arithmetic 143 -1.176643 -1.318345 -1.034942| Geometric 11 .3026761 .1656504 .5530494| Harmonic 11 .2014677 .116911 .7279985
-------------+----------------------------------------------------------
centile
Ejemplo: Se desea conocer los centiles para los percentiles 5, 50 y 95
7/29/2019 Guia de Stata 2
28/37
Bioestadstica
use "C:\inteligencia.dta", clearcentile haz1999, centile(5 50 95)
-- Binom. Interp. --Variable | Obs Percentile Centile [95% Conf. Interval]
-------------+-------------------------------------------------------------haz1999 | 143 5 -2.578 -3.123029 -2.386474
| 50 -1.1 -1.29 -.9526722| 95 .312 -.0852884 .5685576
ci
Ejemplo: Se desea obtener los intervalos de confianza al 95% de confianza de las variableshaz1999 wtotal
use "C:\inteligencia.dta", clear. ci haz1999 wtotal
Variable | Obs Mean Std. Err. [95% Conf. Interval]-------------+---------------------------------------------------------------haz1999 | 143 -1.176643 .0716819 -1.318345 -1.034942wtotal | 143 88.93007 1.047604 86.85916 91.00098
cii
Ejemplo: Se desea estimar un intervalo de confianza de la proporcin de muerte por accidentes si
de 10 accidentes registrados 2 causaron fallecimientos.
. cii 10 2
-- Binomial Exact --Variable | Obs Mean Std. Err. [95% Conf. Interval]
-------------+---------------------------------------------------------------| 10 .2 .1264911 .0252107 .5560955
Ejemplo: Se desea calcular un intervalo de confianza en 166 observaciones, con una media de
19509 y una desviacin estndar de 4379.
. cii 166 19509 4379
Variable | Obs Mean Std. Err. [95% Conf. Interval]-------------+---------------------------------------------------------------
| 166 19509 339.8763 18837.93 20180.07
stem
7/29/2019 Guia de Stata 2
29/37
Bioestadstica
Ejemplo: Se desea obtener una grafico de tallos y hojas para observar si la variable haz1999 para
determinar su distribucin.
use "C:\inteligencia.dta", clear. stem haz1999
Stem-and-leaf plot for haz1999 (Height-for-age Z-score 1999)haz1999 rounded to nearest multiple of .01plot in units of .01
-3** | 48-3** | 34-3** | 13-2** | 84-2** | 68,65-2** | 58,57,56,46,42,41-2** | 39,37,37,36,32,32,26-2** | 18,17,16,14,13,04,00,00-1** | 99,88,87,87,83,81-1** | 78,76,75,75,66,66,61,60-1** | 57,56,56,53,51,51,50,47,46,45,42,41,41-1** | 38,38,37,37,34,29,29,27,26,25,22,20-1** | 19,18,18,17,15,10,09,08,07,05,02,00-0** | 96,96,96,96,96,95,93,91,90,88,88,88,87,86,86,85,84,83,82,80,80
-0** | 76,74,74,71,68,66,66,66,66,63,60-0** | 56,54,51,49,49,49,43,41,41,41-0** | 37,36,29,24,23,22,21-0** | 18,12,11,08,050** | 06,070** | 21,24,33,34,390** | 51,570** | 620** |1** | 17
plot
Ejemplo: Se desea evaluar grficamente la existencia de alguna posible asociacin entre las
variables haz1999 y wtotal
use "C:\inteligencia.dta", clear. plot haz1999 wtotal
1.17 +H | *e |i |g | * * *h | * * * * *t | * *- | * * * * * * * *f | ** * * ** ****o | * * *** ** * *r | * * * ****** *** * * * ** **- | * * * * * * * * * * *a | **** * ** **** * * * *g | * * * ** * *** *
e | * * * * * * *| * * * * * *Z | * * * * ** * *- | * * * *s | *c | *-3.48 + * *
+----------------------------------------------------------------+
55 WISC Total 128
compare
7/29/2019 Guia de Stata 2
30/37
Bioestadstica
Ejemplo: Se desean comparar las variables haz y wtotal
use "C:\inteligencia.dta", clear. compare haz1999 wtotal
---------- difference ----------count minimum average maximum
------------------------------------------------------------------------haz1999
7/29/2019 Guia de Stata 2
31/37
Bioestadstica
Revisin de los conceptos y mtodos de prueba de hiptesis. Asociacin
csPara estudios cohorte transversal cohorte con incidencia acumulada, se
calcula una estimacin puntual del RR asi como su intervalo de confianza.
Realiza una prueba de hiptesis donde Ho: RR = 1
cc Para estudios caso-control, se calcula una estimacin puntual del OR asi comosu intervalo de confianza. Realiza una prueba de hiptesis donde Ho: OR = 1
csiRealiza el calculo de riesgos relativos colocando valores observados de una
tabla 2x2
cciRealiza el calculo de odds ratios colocando valores observados de una tabla
2x2
taboddsUsado para determinar la homogenidad de los OR en los diferentes niveles de
la variable exposicin. Determina si existe tendencia con respecto a los OR.Realiza
mhoddsSe utiliza para calcular odds ratios cuando la variable exposicin tiene mas de
dos niveles. Ademas calcula estadstico de Mantel _ Haenzel
csEste comando es usado para estudio de cohorte transversal cohorte, donde tenemos un grupoexpuesto y grupo no expuesto, adems podemos incorporar variables de ajuste bajo la opcion by,
para calcular RR en cada uno de los grupos. Una nota importante en este calculo es que la
variable exposicin tiene que estar codificado como 0 y 1.
Trabajaremos con la base de datos del estudio de adherencia del tratamiento a la enfermedad de
malaria, donde el objetivo de la investigacin es determinar los RR para la incidencia
proporcin de no adherencia a tratamiento antimalarico para la variable exposicin (Dosis) .
Donde nuestra hiptesis nula es:
La exposicin de dosis mal administrada presenta un RR = 1 respecto de la no adherencia al
tratamiento
Entonces para abrir la base de datos de la investigacin de no adherencia a tratamiento de Malaria
usamos el comando use
use "C:\malaria.dta", clear
Ya que la variable dosis por presenta se construye de dos variables entonces tenemos que
generar la variable dosis con el comandogenerate dosis = ( dos_qkg>1 | dos_tkg>1)
Adems generaremos antes la variable presencia de la enfermedad en esta base de datos presencia
de no adherencia, donde 1 presencia de adherencia y 2 presencia de no adherencia.
generate cumple = (cumfinal == 2)cs cumple malpf
7/29/2019 Guia de Stata 2
32/37
7/29/2019 Guia de Stata 2
33/37
Bioestadstica
Proportion Exposed: Proporcin de exposicin, para casos y controles
Odds ratio: El valor calculado de la razn de productos cruzados.
El cuadro nos dice que rechazamos la hiptesis nula que nos dice que Ho: OR = 1
Adems podemos decir que la baja de peso en grupo casos es 2.6 veces mas que la baja de pesoen el grupo control
csiEl uso del comando csi, esta restringido para estudios de cohorte donde tenemos los valores para
una tabla 2 x 2, este realiza el calculo de los riesgos relativos as como de su intervalo deconfianza.
csi #a #b #c #d
Sea que tenemos los valores para el calculo de los RR, similares al ejemplo de cs
cci
7/29/2019 Guia de Stata 2
34/37
Bioestadstica
El uso del comando csi, esta restringido para estudios de casos y controles donde tenemos los
valores para una tabla 2 x 2, este realiza el calculo del odds ratio as como de su intervalo deconfianza. Este adems puede calcular el estadstico exacto de Fisher.
cci #a #b #c #d
taboddsSe utiliza en estudio de caso control para calcular odds ratios cuando la variable exposicin tienemas de dos niveles.
Utiliza test de homogeneidad para determinar que los OR calculados son iguales entre los
diferentes niveles de exposicin
Utiliza el test de tendencia asumiendo que la variable exposicin tiene un orden , teniendo comohipotesis nula que no hay un incremento del OR cuando el nivel de exposicin se eleva
Realiza el test de Mantel-Haenszel para ajuste de OR con respecto a una tercera variable que
podra ser confusora.
Usaremos la base de datos de malaria como ejemplo teniendo en cuenta que esta base de datos
proviene de un estudio de Cohorte. El ejemplo no es exactamente el mas apropiado.
Usamos el comando use para abrir las base de datos de malaria
use "C:\malaria.dta", clear
El objetivo de utilizar este comando es el de determinar odds ratio para las tres categoras en la
variable antecedentes de malaria (si tuvo malaria Pf, tuvo otra malaria, no tuvo nunca malaria)
7/29/2019 Guia de Stata 2
35/37
7/29/2019 Guia de Stata 2
36/37
7/29/2019 Guia de Stata 2
37/37