FCV - vet.unicen.edu.ar · cuyo valor no esta predeterminado, sino que es azarozo. Veremos después...
Transcript of FCV - vet.unicen.edu.ar · cuyo valor no esta predeterminado, sino que es azarozo. Veremos después...
FCV– Bioestadística – 2017
Bioestadística
FCV– Bioestadística – 2017
Bioestadística
Docentes:
Edgardo Rodríguez
Juan Passucci
Rosana Cepeda
Marcelo Rodriguez
FCV– Bioestadística – 2017
Bioestadística
Curso:
Teórico. 9 hs
Práctico:
Com A: 12-14hs
Com B: 14-16hs
Parciales
Promoción
FCV– Bioestadística – 2017
Bioestadística
Di Rienzo, J.A., Casanoves, F., Gonzalez, L.A., Tablada, E.M., Diaz, M., Robledo, C.W., Balzarini, M.G. (2001) Estadística para las Ciencias Agropecuaria. Editorial Triunfar, Cordoba, Argentina. 4ta edición
FCV– Bioestadística – 2017
Estadística
Conjunto de métodos científicos relacionados con la recolección, presentación y análisis de datos, para la deducción de conclusiones y la toma de decisiones objetivas.
Es el arte de la decisión en presencia de incertidumbre.
FCV– Bioestadística – 2017
Estadística
Descriptiva
Inductiva o Inferencial
(Analítica).
FCV– Bioestadística – 2017
Estadística Descriptiva
Población:
Conjunto de individuos u objetos que presentan una característica común observable. Ubicada en tiempo y espacio
Muestra:
Parte de la población, que mantiene las características de la misma. Solo debe diferir en el tamaño. Subconjunto.
FCV– Bioestadística – 2017
Estadística Descriptiva
Variable:
Característica o propiedad de los elementos de la población, que podemos medir u observar y que difieren entre sí.
Variable aleatoria Característica de los elementos de la población, cuyo valor no esta predeterminado, sino que es azarozo. Veremos después una definición más formal.
FCV– Bioestadística – 2017
Estadística Descriptiva
Tipos de variables
Cuantitativas Discretas: Número de animales, cantidad de
huevos
Continuas: Peso corporal, altura, edad, presión arterial.
Cualitativas o categóricas Nominales: Sexo, raza, sanos y enfermos
Ordinales: Chico, mediano y grande
Alto, mediano y bajo
FCV– Bioestadística – 2017
Estadística Descriptiva
Recolección de datos Censo:
se recolecta la información de todos los individuos de la población
Muestreo:
se mide una parte de la población (subconjunto)
Fuentes: Primaria o secundaria
Depuración de datos
FCV– Bioestadística – 2017
Estadística descriptiva
Presentación de datos Tablas
Simples (categorías o intervalos de clase)
Doble entrada
Maestras
FCV– Bioestadística – 2017
Tabla Simple
año Frec.
1 320
2 240
3 190
4 180
5 170
Total 1100
Tabla 1. Cantidad de alumnos en FCV, según año de la carrera. Tandil. 2010
FCV– Bioestadística – 2017
Tabla Doble Entrada
año Mujeres Varones Total
1 120 200 320
2 100 140 240
3 90 100 190
4 70 110 180
5 50 120 170
Total 430 670 1100
Tabla 2. Cantidad de alumnos en FCV, por genero, según año de la carrera. Tandil. 2010
FCV– Bioestadística – 2017
Tabla Maestra
Bs. As. Resto del País
años Mujeres Varones Mujeres Varones Total
1 80 120 40 80 320
2 60 90 40 50 240
3 60 60 30 40 190
4 50 80 20 30 180
5 35 80 15 40 170
Total 285 430 145 240 1100
Tabla 3. Cantidad de alumnos en FCV, por procedencia y genero, según año de la carrera. Tandil. 2010
FCV– Bioestadística – 2017
Ejemplo
10 8 6 3 9 7 5 4 6 9
8 10 7 9 10 6 8 6 3 2
4 3 2 7 5 5 4 3 7 6
6 7 8 8 6 7 7 7 9 8
5 3 2 1 4 3 0 6 6 8
Un experiencia consistió en contar el número de crías por perra (n=50). Los valores resultantes del conteo fueron los siguientes:
FCV– Bioestadística – 2017
Ejemplo Tabla 4. Distribución de frecuencias para la variable número de crías
por perra, en el criadero “Mascotas.com”, en 2010.
Nº de crías Frec. Frec. rel. Frec. acum. Frec. acum. rel.
0 1 0.02 1 0.02
1 1 0.02 2 0.04
2 3 0.06 5 0.10
3 6 0.12 11 0.22
4 4 0.08 15 0.30
5 4 0.08 19 0.38
6 9 0.18 28 0.56
7 8 0.16 36 0.72
8 7 0.14 43 0.86
9 4 0.08 47 0.94
10 3 0.06 50 1
FCV– Bioestadística – 2017
Ganancias de peso de 46 terneros:
39.6 44.4 43.9 42.9 47.9 46.9 48.3 40.4 45.8 44.2 39.1 46.3 41.9 51.2 50.2 47.7 43.9 47.0 42.6 46.6 44.8 43.7 47.2 41.3 37.4 43.1 43.9 48.9 41.5 42.5 48.2 40.7 41.8 46.7 42.3 43.3 44.1 49.8 40.6 44.0 44.0 44.5 45.1 45.4 45.2 45.7
Identificamos el valor mínimo y el máximo
Calculamos el rango
8.134.372.51 LiLsAprango
Dividimos por la cantidad de intervalos
76.25
8.13
5
LiLs
Ejemplo
FCV– Bioestadística – 2017
Intervalos x´ frec. frec.rel.
(37.40-40.16) 38.78
(40.16-42.92) 41.54
(42.92-45.68) 44.30
(45.68-48.44) 47.06
(48.44-51.20) 49.82
FCV– Bioestadística – 2017
Iintervalos x´ frec. frec.rel.
(37.40-40.16) 38.78 3 0.07
(40.16-42.92) 41.54 11 0.24
(42.92-45.68) 44.30 16 0.35
(45.68-48.44) 47.06 12 0.26
(48.44-51.20) 49.82 4 0.09
FCV– Bioestadística – 2017
|
35 38 41 44 47 50 53
pesos
0.00
0.09
0.18
0.28
0.37
fre
cu
en
cia
s r
ela
tiva
s
FCV– Bioestadística – 2017
fa far fa farIintervalos x´ frec. frec.rel.
(37.40-40.16) 38.78 3 0.07 3 0.07 46 1
(40.16-42.92) 41.54 11 0.24 14 0.30 43 0.93
(42.92-45.68) 44.30 16 0.35 30 0.65 32 0.70
(45.68-48.44) 47.06 12 0.26 42 0.91 16 0.35
(48.44-51.20) 49.82 4 0.09 46 1 4 0.09
FCV– Bioestadística – 2017
Estadística descriptiva
Representación de datos
Gráficos
Cuantitativas
Histograma
Grafico de tallos y hojas
Polígono de frecuencias
Grafico de cajas
Cualitativas
Gráfico de barras
Gráficos circulares
FCV– Bioestadística – 2017
Histograma
0
1
2
3
4
5
6
7
8
9
10
0 1 2 3 4 5 6 7 8 9 10 11
Edad
Frecu
en
cia
FCV– Bioestadística – 2017
Polígono de frecuencia
0
1
2
3
4
5
6
7
8
9
10
0 2 4 6 8 10
Años
Frecu
en
cia
FCV– Bioestadística – 2017
Stem Leaf # 9 0 1 8 0 1 7 000 3 6 000000 6 5 00000000000 11 4 000000000000000 15 3 0000000000 10 2 00000 5 1 000 3 ----+----+----+----+---+
Gráfico de Tallos y Hojas
FCV– Bioestadística – 2017
Gráfico de caja
0
1
2
3
4
6
7
8
9
10
Nº
crí
as
FCV– Bioestadística – 2017
Gráfico de Barras
0
10
20
30
40
50
60
70
80
90
%
1er trim. 2do trim. 3er trim. 4to trim.
Chicos Medianos Grandes
FCV– Bioestadística – 2017
Gráfico de Circular
Buenos Aires Tucuman Misiones Salta La Pampa
FCV– Bioestadística – 2017
Estadística descriptiva
Resumen de la información Cuantitativos
Medidas de Tendencia Central (o posición)
Medidas de Dispersión
Cualitativos
Razón
Proporción
Tasas
Indices
FCV– Bioestadística – 2017
M.T.C
Las medidas de tendencia central son valores numéricos localizados en el centro del conjunto de datos y que los representan adecuadamente a los fines de análisis.
Las medidas más utilizadas son la media, la mediana y la moda
FCV– Bioestadística – 2017
M.T.C.
0 25 50 75 100 125 150 175 200
Peso
0.00
0.04
0.09
0.13
0.17
fre
cu
en
cia
s r
ela
tiva
s
Población= A
FCV– Bioestadística – 2017
M.T.C.
0 25 50 75 100 125 150 175 200
Peso
0.00
0.04
0.09
0.13
0.17
fre
cu
en
cia
s r
ela
tiva
s
Población= B
FCV– Bioestadística – 2017
M.T.C.
0 25 50 75 100 125 150 175 200
Peso
0.00
0.04
0.09
0.13
0.17
fre
cu
en
cia
s r
ela
tiva
s
Población= C
FCV– Bioestadística – 2017
M.T.C.
Media Aritmética: La media aritmética es el promedio de todas las observaciones.
Ejemplo: Calcular la media aritmética para el siguiente conjunto de datos.
5 9 12 7 15 3
(5+9+12+7+15+3)/6 = 51/6 = 8.5
Por lo tanto, la media aritmética es: 8.5
n
xf
x
n
i
ii
1𝑥 = 𝑥𝑖𝑛𝑖
𝑛
FCV– Bioestadística – 2017
M.T.C
Moda: El valor que más se repite (puede no existir y si existe puede no ser única).
Ejemplo: Se le preguntó a una muestra de 10 estudiantes por el número de hermanos que tiene. Sus respuestas fueron: 2, 1, 2, 0, 0, 1, 4, 5, 2, 3.
La moda es 2 porque se repite tres veces. Interpretación: La mayoría de estudiantes tienen dos hermanos.
FCV– Bioestadística – 2017
M.T.C
Mediana: es el valor que se encuentra en el centro del conjunto de datos “ordenados”. Por lo tanto, el 50% de los datos son menores que la mediana.
La mediana se utiliza cuando los datos presentan valores muy extremos. Cuando la media aritmética no es muy representativa del conjunto.
FCV– Bioestadística – 2017
M.T.C
Si n es impar la mediana es la observación que está en el lugar (n+1)/2:
Si n es par: la mediana es el promedio de las observaciones n/2 y (n/2)+1:
2
1
nXMd
2
122
nn XX
Md
FCV– Bioestadística – 2017
M.T.C
Ejemplo: Encontrar la mediana para el siguiente conjunto de datos:
9 12 5 16 8 3 11
Primero se ordenan los datos:
3 5 8 9 11 12 16
Una vez ordenados, como el número de datos es impar (7), se busca el que tiene la posición (n+1)/2, o sea (7+1)/2 = 4. Este número es el 9 y representa la mediana.
FCV– Bioestadística – 2017
M.T.C
Ejemplo: Calcula la mediana para el siguiente conjunto de datos
8.3 5.7 9.2 3.9 7.4 11.8 10.6 4.3
Nuevamente se ordenan los datos
3.9 4.3 5.7 7.4 8.3 9.2 10.6 11.8
Una vez ordenados, como el número de datos es par (8), se busca el número que tiene la posición n/2 y el que tiene la posición (n/2)+1. En este caso 8/2 =4 y (8/2)+1 =5
Los números que tienen las posiciones cuarta y quinta son 7.4 y 8.3. Estos números se promedian y el resultado será la mediana:(7.4+8.3)/2 = 7.85.
FCV– Bioestadística – 2017
M.T.C.
Media Armónica
Media Geométrica
n
i Xi
nMh
1
1
k
i Xifi
nMh
1
1
ni
n
i
nni xxxxxMG ........
132
FCV– Bioestadística – 2017
Media Aritmética
Propiedades
La suma las desviaciones de cada valor de la variable respecto al promedio es cero
suma de cuadrados mínima
n
i
i xx1
0)(
n
i
i
n
i
i Axxx1
2
1
2 )()(
FCV– Bioestadística – 2017
Media Aritmética
Propiedades
Si a cada observación se le suma (o resta) un valor constante c, el promedio de la nueva variable será igual al promedio de los valores originales, más (o menos) la constante c.
Sea x1, x2, x3, . . ., xn un conjunto de observaciones de la variable X y c una constante, y la variable Y es tal que:
Luego:
cxy ii
cXn
yY
n
i
i 1
FCV– Bioestadística – 2017
Media Aritmética
Propiedades Si a cada observación xi se la multiplica (o divide) por
una constante k la media aritmética de la nueva variable será igual al promedio original multiplicado (o dividido) por la constante k
Sea x1, x2, x3, . . ., xn un conjunto de observaciones de la variable X y k una constante, y la variable Y es tal que:
Luego:
ii xky *
Xkn
xk
n
kx
n
yY
n
i
in
i
in
i
i 111
FCV– Bioestadística – 2017
Media Aritmética
Propiedades
Si xi = k para todo i, donde k es constante luego el promedio es k
Sean X1 y X2 dos variables “aleatorias” y hacemos yi = x1i + x2i luego
21 XXY
FCV– Bioestadística – 2017
Medidas de Dispersión
Son medidas que nos dicen qué tan dispersos se encuentran los datos con respecto a su media.
VARIANCIA S2 :La variancia) es el promedio de las desviaciones al cuadrado entre los datos y su media aritmética
1
)(
ˆ)(var 1
2
22
n
xx
SX
n
i
i
FCV– Bioestadística – 2017
Medidas de dispersión
Desvio estandar
Amplitud ó Rango Rango= xmáx-xmín
Desvio medio
2SS
1.. 1
n
xx
MD
n
i
FCV– Bioestadística – 2017
Medidas de Dispersión
Coeficiente de Variabilidad
Covariancia
100.. x
SVC
1),cov( 1
n
yyxx
yxi
n
i
i
FCV– Bioestadística – 2017
Error estandar
n
S
n
See
2
..
FCV– Bioestadística – 2017
Variancia
Propiedades Var (x)0
Si k es constante, luego Var(k)=0
Var(kx)=k2 Var(x)
Var(k+x)=Var(x)
Sean X e Y dos variables “aleatorias”, luego
Var(x+y)=Var(x) + Var(y) + 2cov(x,y)
Var(x-y)=Var(x) + Var(y) - 2cov(x,y)