Universidad Politécnica Estatal del Carchi
Comercio Internacional, Integración, Administración y Economía Empresarial.
Escuela: Comercio Exterior y Negociación Comercial Internacional
“Estadística Inferencial”
“MODULO DEL ESTUDIANTE”
Msc. Jorge Pozo
Autor:
Jonathan Haro
Nivel: sexto Paralelo: “A”
Marzo-Agosto 2012
Tulcán-Ecuador
Contenido Modulo De Estadistica ...........................................................................................................8
CAPITULO I ...............................................................................................................................8
1.1Introducción ......................................................................................................................8
1.2 Definición De Estadística ...............................................................................................9
1.3 Clasificación De La Estadística ................................................................................... 10
Estdistica Descriptiva .......................................................................................................... 10
Frecuencia: ........................................................................................................................... 10
1.1 Distribución De Frecuencias Absolutas Y Relativas ........................................... 10
1.2 Tabla De Frecuencias: ............................................................................................ 11
1.3 Frecuencia Absoluta ................................................................................................ 11
1.4 Frecuencia Relativa: ................................................................................................ 12
1.5 Forma De Cálculo .................................................................................................... 13
1.6 Frecuencia Acumulada ........................................................................................... 13
1.7 Gráficas ..................................................................................................................... 15
1.8 Histograma ............................................................................................................... 15
1.9 Histograma Y Polígono De Frecuencias. ............................................................. 16
1.10 Para Trazar El Histograma, La Secuencia De Operaciones Es: ....................... 16
1.11 Medidas De Tendencia Central ............................................................................. 19
Definiciones ........................................................................................................................ 19
Las Medidas De Tendencia Central Más Comunes Son: ......................................... 19
Media Aritmética O Promedio.................................................................................. 20
Definición: ........................................................................................................................... 20
Características De La Media Aritmética: ..................................................................... 20
1.12 Formula ..................................................................................................................... 21
1.13 Mediana (Med) ........................................................................................................ 23
1.14 Definición: ................................................................................................................. 23
1.15 Características De La Mediana.............................................................................. 23
1.16 Formas De Cálculo .................................................................................................. 24
1.17 Mediana Para Datos No Agrupados: .................................................................... 24
1.18 Mediana Para Datos Agrupados: .......................................................................... 25
1.19 Ejemplo 2: ................................................................................................................. 26
2 Moda ................................................................................................................................. 30
2.1 Características De La Moda. .................................................................................. 30
2.2 Formas De Cálculo: ................................................................................................. 30
2.3 Datos Agrupados: .................................................................................................... 31
2.4 Cuartiles .................................................................................................................... 32
2.5 Cálculo De Los Cuartiles ........................................................................................ 32
2.6 Cálculo De Los Cuartiles Para Datos Agrupados ............................................... 33
2.7 Ejercicios De Cuartiles ............................................................................................ 33
Deciles ................................................................................................................................. 34
Cálculo De Los Deciles .................................................................................................... 34
Ejercicio De Deciles .......................................................................................................... 35
Percentiles .......................................................................................................................... 37
Cálculo De Los Percentiles ............................................................................................ 37
Organizador Grafico De Las Medidas De Tendencia Central ........................................... 39
CAPITULO II ............................................................................................................................ 43
Medidas De Dispersión ....................................................................................................... 43
2.8 Rango, Amplitud Total O Recorrido ...................................................................... 43
2.9 Definicion .................................................................................................................. 43
2.10 Caracterìsticas ......................................................................................................... 44
2.11 Características Del Rango ...................................................................................... 44
2.12 Formula ..................................................................................................................... 44
2.13 Formas De Cálculo. ................................................................................................. 44
3 La Varianza ...................................................................................................................... 45
3.1 Definicion .................................................................................................................. 45
3.2 Forma De Cálculo .................................................................................................... 46
3.3 Desviación Media .................................................................................................... 47
3.4 Definición .................................................................................................................. 47
3.5 Desviación Típica .................................................................................................... 49
3.6 Cálculo De La Desviación Típica Para Datos No Agrupados En Clases ......... 50
3.7 Cálculo De La Desviación Típica Para Datos Agrupados En Clases Y
Agrupados Por Frecuencias............................................................................................... 50
4 ................................................................................................................................................. 51
5 Pasos Para Descargar E Instalar El Spss .................................................................... 52
5.1 Pasos Para Resolver El Caso En Spss: ............................................................... 55
6 ................................................................................................................................................. 62
7 Organizador Grafico De Las Medidas De Dispersión ................................................. 63
8 CAPITULO III ................................................................................................................... 65
8.1 Tema: Muestreo ....................................................................................................... 65
Definicion ............................................................................................................................ 65
8.2 Muestreo Probabilístico: ......................................................................................... 66
8.3 Sistemático ............................................................................................................... 67
8.4 Estratégico ................................................................................................................ 67
8.5 Muestreo No Probabilístico: ................................................................................... 68
8.6 Casual. ...................................................................................................................... 68
8.7 Intencional ................................................................................................................ 68
8.8 Cuotas. ...................................................................................................................... 68
8.9 Determinar El Tamaño De La Muestra ................................................................. 69
8.10 Ejemplos: .................................................................................................................. 70
8.11 Población Finita........................................................................................................ 72
9 Campana De Gaus .......................................................................................................... 74
9.1 Ejemplos De La Campana De Gaus: .................................................................... 74
9.2 1.) Calcular La Probabilidad Del Evento ............................................................... 74
9.3 2.) Calcular La Probabilidad Del Evento ............................................................... 75
9.4 Desarrollo.................................................................................................................. 76
10 Variables ....................................................................................................................... 78
10.1 Definición De Variable ............................................................................................. 78
10.2 Ejemplo De Variables: ............................................................................................. 79
10.3 Clasificación De Las Variables: ............................................................................. 79
10.4 Variable Dependiente: ............................................................................................. 79
10.5 Variable Independiente: .......................................................................................... 80
11 CAPITULO IV............................................................................................................... 83
11.1 1.3.2. Tema: Estadística Inferencial ...................................................................... 83
11.2 Correlación ............................................................................................................... 83
11.3 Coeficiente De Correlación.. .................................................................................. 83
11.4 Relación Lineal......................................................................................................... 84
11.5 Coeficiente De Correlación De Pearson ............................................................... 86
11.6 Interpretación.. ......................................................................................................... 87
11.7 Calcular El R De Pearson. ...................................................................................... 87
12 Coeficiente De Correlación De Rangos De Sperman............................................. 87
12.1 Coeficiente Intelectual ............................................................................................. 88
12.2 Coeficiente R De Pearson ...................................................................................... 89
14 Regresión Lineal .......................................................................................................... 89
14.1 Definición De Correlación Lineal ........................................................................... 90
14.2 El Coeficiente De Correlación Lineal De Pearson R ........................................... 96
14.3 Definición Y Características Del Concepto De Regresión Lineal ...................... 98
14.4 Organizador Grafico De Correlacion Y Regrecion Lineal ............................... 104
14.5 Ejercicios De Correlacion Y Regrecion Lineal .................................................. 105
15 Características De Las Hipótesis ............................................................................ 111
15.1 Ejemplo: El Contrabando En Ecuador Es Menor Que El Contrabando En
Colombia ............................................................................................................................. 111
15.2 Clasificación De Las Hipótesis ............................................................................. 112
15.3 Hipótesis De Investigacion ................................................................................... 112
15.4 Hipotesis Nula ........................................................................................................ 112
15.5 Hipotesis Alternativa .............................................................................................. 112
15.6 Hipotesis Estadistica ............................................................................................. 112
15.7 Ejemplo De Hipótesis: ........................................................................................... 112
15.8 Hipótesis De Un Valor O Dato Pronósticado: ................................................... 113
15.9 Hipótesis Correlacionadas:................................................................................... 113
15.10 Hipótesis De Diferencia Entre Grupos: ............................................................... 114
15.11 Hipótesis Causales: ............................................................................................... 114
15.12 Hipótesis Nula (Ho): ............................................................................................. 114
15.13 Hipótesis Alternativa (Ha): ................................................................................... 115
15.14 Hipótesis Estadística: ........................................................................................... 116
15.15 Hipótesis Estadísticas De Estimación:............................................................... 116
15.16 Hipótesis Estadísticas De Correlación: .............................................................. 116
15.17 Hipótesis Estadisticas De La Diferencia De Medias U Otros Valores: .......... 116
15.18 Ejemplos De Hipotesis: ........................................................................................ 116
15.19 Hipótesis Descriptiva ............................................................................................ 116
15.20 Pasos Para La Prueba De Hipotesis................................................................. 118
15.21 Prueba De Diferencias De Medias ..................................................................... 121
16 “T“De Student ............................................................................................................. 127
16.1 Características ....................................................................................................... 127
16.2 Grado De Libertad: ................................................................................................ 127
16.4 Formulacion De Hipotesis .................................................................................... 128
17 Prueba De Ji- Cuadrado O ............................................................................. 133
17.1 Propiedades De Las Distribuciones Ji-Cuadrado .............................................. 133
17.2 Frecuencias Observadas ...................................................................................... 138
17.3 Frecuencias Esperadas (De Ho) ......................................................................... 138
18 Conclusiónes .............................................................................................................. 142
19 Recomendaciones ..................................................................................................... 143
20 10. Financieros Y Técnicos. ..................................................................................... 144
21 9. Cronograma De Tareas ........................................................................................ 144
22 Anexos ........................................................................................................................ 146
22.1 Organizador Grafico De La Estadistica Descriptiva E Inferencial ................... 147
22.2 Tema: Proyecto De Aplicación Al Comercio Exterior Aplicando Correlación,
Regresión Lineal Simple Aplicando, Prueba De Hipótesis, T-Student Y Chi2 Con
Ayuda Del Programa Spss. .............................................................................................. 151
22.3 1.2 Problema .......................................................................................................... 151
22.4 1.3 Objetivos........................................................................................................... 151
22.5 Objetivo General .................................................................................................... 151
22.6 Objetivos Específicos ............................................................................................ 151
22.7 3. Justificación ........................................................................................................ 152
1.5 Marco Teórico ....................................................................................................... 153
22.8 El Spss .................................................................................................................... 153
22.9 Correlación Lineal .................................................................................................. 154
22.10 Técnicas De Correlación................................................................................... 155
22.11 Relaciones Lineales Entre Variables .............................................................. 155
22.12 Diagrama De Dispersión ................................................................................... 157
22.13 Coeficiente De Correlación Rectilínea De Pearson ...................................... 157
22.14 Correlación ......................................................................................................... 157
22.15 Desarrollo ............................................................................................................ 158
22.16 Regresión Lineal ................................................................................................ 160
22.17 Fases Del Modelo De Regresión Lineal ......................................................... 160
22.18 El Modelo De Regresión Lineal ....................................................................... 160
22.19 Relación Lineal ................................................................................................... 161
22.20 Desarrollo ............................................................................................................ 163
22.21 Encontrar La Ecuación ...................................................................................... 165
22.22 Prueba De Hipótesis.......................................................................................... 168
22.23 Hipótesis Nula Y Alternativa ............................................................................. 168
22.24 Selección Del Nivel De Significancia .............................................................. 169
22.25 Error Tipo I Y Error Tipo Ii................................................................................. 170
22.26 Pasos De Una Prueba De Hipótesis ............................................................... 170
22.27 Formular La Hipótesis Alternativa Ha .............................................................. 170
22.28 T De Student ...................................................................................................... 171
22.29 Propiedades: ...................................................................................................... 171
22.30 Chi- Cuadrado .................................................................................................... 174
22.31 Pruebas Paramétricas ....................................................................................... 174
22.32 Pruebas No Paramétricas................................................................................. 174
22.33 Varianza .............................................................................................................. 179
22.34 Variable Dependiente O Variable Respuesta. ............................................... 180
22.35 Nivel O Tratamiento Del Factor:. ..................................................................... 180
22.36 Unidad Experimental ......................................................................................... 180
22.37 Error Experimental ............................................................................................. 180
22.38 Aleatorización:. ................................................................................................... 180
22.39 Abstract ............................................................................................................... 182
22.40 Evaluaciones De Estadistica Inferencial ........... ¡Error! Marcador no definido.
MODULO DE ESTADISTICA
CAPITULO I
1.1 INTRODUCCIÓN
Los profesionales de la educación, como parte de su quehacer profesional,
realizan investigación científica: evaluación de la calidad de la educación,
someten a prueba diferentes métodos de comprensión lectora, estudian
problemas del aprendizaje, entre otros. Es así, que contamos con Internet,
como fuente general de información, que permite disponer de información
educativa, por ejemplo, sobre evaluaciones muéstrales, que realiza el
Ministerio de Educación y que está disponible en la página web.
Una vez que conoce tanto la forma de recoger información como la forma de
presentar a la misma, sea en forma de tablas o con el tratamiento realizado
para elaborar una tabla de frecuencias, ahora es conveniente seguir con las
características que permiten describir a un conjunto de datos que se recogen
de un problema a investigarse.
La Estadística es una disciplina que utiliza recursos matemáticos para
organizar y resumir una gran cantidad de datos obtenidos de la realidad, e
inferir conclusiones respecto de ellos. Por ejemplo, la estadística interviene
cuando se quiere conocer el estado sanitario de un país, a través de ciertos
parámetros como la tasa de morbilidad o mortalidad de la población.
En este caso la estadística describe la muestra en términos de datos
organizados y resumidos, y luego infiere conclusiones respecto de la población.
Aplicada a la investigación científica, también infiere cuando provee los medios
matemáticos para establecer si una hipótesis debe o no ser rechazada. La
estadística puede aplicarse a cualquier ámbito de la realidad, y por ello es
utilizada en física, química, biología, medicina, astronomía, psicología,
sociología, lingüística, demografía, etc.
1.2 DEFINICIÓN DE ESTADÍSTICA
La estadística es la ciencia formada por un conjunto de teorías y técnicas
cuantitativas, que tiene por objeto la organización, presentación, descripción,
resumen y comparación de conjuntos de datos numéricos, obtenidos de
poblaciones en su conjunto de individuos o fenómenos o bien de muestras que
representan las poblaciones estudiadas, así como el estudio de su variación,
propiedades, relaciones, comportamiento probabilístico de dichos datos y la
estimación, inferencia o generalización de los resultados obtenidos de
muestras, respecto a las poblaciones que aquéllas representan. La estadística
en la investigación científica, dada la necesidad de manejar y tratar en ellas
grandes cantidades, progresivamente crecientes, de datos”.
(http://www.AulaFacil.com)
Irma Nocedo de León et al (2001), anotan que “la estadística es la ciencia
encargada de suministrar las diferentes técnicas y procedimientos que permiten
desde organizar la recolección de datos hasta su elaboración, análisis e
interpretación. Abarca dos campos fundamentales la estadística descriptiva y la
estadística inferencial. (http://www.Wikipedia: Estadísticas.)
1.3 CLASIFICACIÓN DE LA ESTADÍSTICA
Dependiendo de cómo se analizan los datos, la Estadística se clasifica como:
ESTDISTICA DESCRIPTIVA
Estadística Descriptiva.- Rama de la estadística que trata sobre la
descripción y análisis estadístico de una población, que resume y presenta
datos obtenidos de la población o de una muestra, mediante métodos
adecuados. Tiene como objetivo caracterizar los datos, de manera gráfica o
analítica, para resaltar las propiedades de los elementos bajo estudio.
(http://www.Wikipedia: Estadísticas.)
FRECUENCIA:
Es el número de veces que se repite un dato.
Es el número de repeticiones que presenta una observación. Se
representa por ni. http://www.mitecnologico.com
Es el número de veces que aparece cualquier valor de la variable. Se
representa por fi. En algunos libros de texto nos la encontraremos
representada por ni. http://www.quequieredecir.com.
1.1 DISTRIBUCIÓN DE FRECUENCIAS ABSOLUTAS Y RELATIVAS
Las primeras tareas de la Estadística descriptiva son ordenar, clasificar y
resumir los datos obtenidos en la investigación de campo, para ello se
concentran en tablas de frecuencia y éstas pueden ser:
a) Absoluta.
b) Relativa.
c) Acumulada.
Con el análisis de las frecuencias podemos determinar la tendencia de la
variable en estudio que como ya se dijo, ésta puede ser nominal, ordinal o
cuantitativa y sus respectivas escalas de medición: nominal, ordinal o por
intervalos, respectivamente.
EJEMPLO: La maestra de orientación del Plantel 11 dio una conferencia al
grupo 603 sobre las características y bondades de las carreras de Ingeniería,
Química Metalúrgica y Actuaría. Al final de la conferencia pidió que llenaran un
cuestionario donde especificaron además de los datos personales, la carrera
de preferencia. Se obtuvieron los siguientes resultados: I, A, M, Q, Q, M,
A, I, M, Q, A, Q, I, Q, M,
Q, M, M, A, Q, I, Q, M, I, I, Q, M, M, A, I,
M, A, A, Q, I, M, Q, Q, A, M, A, Q, M, A, Q,
1.2 Tabla De Frecuencias:
Carrera que prefieren los alumnos del grupo 603 del Plantel 11 del Colegio de
Bachilleres.
Encuesta realizada por la maestra de orientación del Plantel 11, el 12 de
septiembre de 1993.
El número de columnas de una tabla es variable y depende de la
información que se quiera registrar.
En nuestro ejemplo podemos suprimir la columna 2 que representa el
conteo de la variable el cual se puede realizar en otras hojas de trabajo.
En la tercera columna se registra la frecuencia.
1.3 FRECUENCIA ABSOLUTA
En una muestra estadística, número de veces que aparece un determinado
carácter. http://nuestrosalud.com/ frecuencia-absoluta.html
El número de los miembros de una serie estadística, que es al intervalo
determinado de los significados de la cantidad variable dada casual; en
particular, el número de los casos con dado o los valores dados del elemento
durante todo el tiempo de las observaciones. http://www.quequieredecir.org.
1.4 FRECUENCIA RELATIVA:
Cociente entre la frecuencia absoluta y el número de casos de una
muestra. http://www.quequieredecir.org/frecuencia/
La frecuencia relativa es el cociente entre la frecuencia absoluta de un
determinado valor y el número total de datos.
http://www.mitecnologico.com
FRECUENCIAS ABSOLUTAS
Simple (Ni) Acumulada (Ni)
Ni Ni
n2 ni+n2
n3 ni+n2+n3
.
. . .
Nn n
FRECUENCIA RELATIVA
Simple Acumulada
hi=n1|n h1
h2=n2|n h1+h2
.
. . .
hn= nn/n h
1.5 FORMA DE CÁLCULO
EJEMPLO
La puntuación obtenida en un examen que se aplicó a 100 obreros de la fábrica
de vidrio el Fanal, es la que se muestra en la siguiente tabla de frecuencias: 46
Resultados del examen aplicado a 100 obreros de la fábrica de vidrio el
Fanal.
Investigación realizada por el jefe del departamento de capacitación de la
fábrica de vidrio el Fanal, el 5 de septiembre de 1993.
1.6 FRECUENCIA ACUMULADA
La frecuencia acumulada (Fi) es otra característica de la muestra que nos
permitirá determinar la posición de un caso particular que nos interese en
comparación con el total de los elementos. ((Levin Richard & Rubin David))
DEFINICIÓN:
Su definición matemática es:
Al calcular la frecuencia acumulada (F1) podemos determinar su frecuencia
relativa acumulada (Fr) en la forma ya explicada mediante la ecuación (1), esto
es: n
Regresemos al problema (11) de las llamadas telefónicas y calculemos la
frecuencia acumulada (f1) y la frecuencia relativa acumulada (Fr). Frecuencia
acumulada (Fi) de una clase es la que se obtiene sumando las frecuencias de
las clases anteriores con la frecuencia de ésta.
La frecuencia acumulada para la 4ta. Clase es F = 45; de este valor se infiere
que hasta esta clase corresponden 45 de las 60 observaciones realizadas.
También se infiere que a esta clase corresponden un número menor o igual a
43 llamadas telefónicas. La frecuencia relativa de esta clase es F = 0.75. Este
valor significa que hasta esta clase corresponde el 75% de todas las llamadas.
1.7 GRÁFICAS
Al representar en una gráfica la información concentrada en la tabla de
frecuencias, ésta es un recurso visual que nos permite tener una idea clara,
precisa, global y rápida acerca de las observaciones de una muestra o
población. Existen muchos tipos de gráficas en las que se pueden representar
la frecuencia absoluta (fi), relativa (fr) y acumulada (Fi) y con ellas podemos
estimar algunos valores con la simple observación.
1.8 HISTOGRAMA
Es uno de los medios expresada en % con mayor frecuencia, es una
representación gráfica de la distribución de frecuencias.
Se utilizan para representar tablas de frecuencias con datos agrupados en
intervalos. Si los intervalos son todos iguales, cada uno de ellos es la base de
un rectángulo cuya altura es proporcional a la frecuencia correspondiente.
http://www.monografias.com/ conceptos-de-estadistica.shtml
En estadística, un histograma es una representación gráfica de una variable en
forma de barras, donde la superficie de cada barra es proporcional a la
frecuencia de los valores representados. En el eje vertical se representan las
frecuencias, y en el eje horizontal los valores de las variables, normalmente
señalando las marcas de clase. http://es.wikipedia.org/wiki/Histograma
1.9 HISTOGRAMA Y POLÍGONO DE FRECUENCIAS.
El histograma es la forma más usual para analizar las características
observables de una variable continua (http://www.monografias.shtml)
Histograma es la representación gráfica en el plano coordenado de las
características concentradas en la tabla de frecuencias de una variable
continua. (http://www.monografia.com/estadistica)
1.10 Para trazar el histograma, la secuencia de operaciones es:
1. En los ejes coordenados del plano cartesiano representamos los datos de la
siguiente forma:
a) En el eje de las abscisas (horizontal) se representan las clases con
sus límites reales de clase y las marcas de clase (Mi) de cada intervalo.
b) En el eje de las ordenadas (vertical) representamos las frecuencias
absolutas en que ocurre la variable.
Analicemos El Siguiente Problema:
Al gerente general de la empresa “Conductores Monterrey” le interesa conocer
la antigüedad de sus trabajadores, por lo que le indica al gerente de personal
que realice un análisis del problema.
El gerente de personal recabó de los expedientes la siguiente información
sobre los años de antigüedad:
13, 19, 22, 14, 13, 16, 19, 21
23, 11, 27, 25, 17, 17, 13, 20
23, 17, 26, 20, 24, 15, 20, 21
23, 17, 29, 17, 19, 14, 20, 20
10, 22, 18, 25, 16, 23, 19, 20
21, 17, 18, 24, 21, 20, 19, 26
Con esta información decidió representarlos en una gráfica (histograma).
Recuerda la secuencia de operaciones que establecimos:
1. Ordenamos los datos en sentido creciente:
10, 11, 13, 13, 13, 14, 14, 15, 16, 16, 17, 17, 17, 17, 17, 17, 18,
18, 19, 19, 19, 19, 19, 20, 20, 20, 20, 20, 20, 20, 21, 21, 21, 21,
22, 22, 23, 23, 23, 23, 24, 24, 25, 25, 26, 26, 27, 29.
2. Calculamos el rango R, para ello determinamos los valores mayor y
menor de las puntuaciones.
X n = 29
Xi = 10
3. Calculamos R = X n – X1 = 29 – 10 = 19
R = 19
4. Calculamos el número de clases (K), para ello determinamos (n)
N = 48; K = 1 + 3.322 log48 = 1 + 3.322 (1.68) = 1 + 5.58 = 6.58 K = 7
5. Determinamos la amplitud de cada clase (A)
R = 19 = 2.7K 7
Se han redondeado los valores de K y A porque el número de clases y la
amplitud de la clase nunca serán fraccionarios.
6. Determinamos cada intervalo de clase y para ello calculamos los límites de
clase y los registramos en la primera columna de la tabla.
7. Trazamos los ejes del plano coordenado, fijamos una escala para cada eje y
representamos en el vertical las frecuencias y en el eje horizontal las clases.
La mayor frecuencia es f4 = 16 por lo que con la escala establecida en cm.
Marcamos 16 divisiones en el eje vertical. En el eje horizontal no es necesario
iniciar por el cero, en nuestro ejemplo podemos iniciar a partir de 9, indicando
que se trunca una parte del eje horizontal.
1.11 MEDIDAS DE TENDENCIA CENTRAL
DEFINICIONES
También se conocen como medidas de ubicación. Para que entienda
estos conceptos remítase al texto en la parte introductoria del capítulo (Levin
Richard & Rubin David).
Las medidas de tendencia central (media, mediana y moda) sirven como
puntos de referencia para interpretar las calificaciones que se obtienen en una
prueba. ((Kazmier & Díaz Mata, 1993:)
1. Sirve como un método para comparar o interpretar cualquier puntaje
en relación con el puntaje central o típico.
2. Mostrar en qué lugar se ubica la persona promedio o típica del grupo.
3. Sirve como un método para comparar el puntaje obtenido por una
misma persona en dos diferentes ocasiones.
4. Sirve como un método para comparar los resultados medios
obtenidos por dos o más grupos.
LAS MEDIDAS DE TENDENCIA CENTRAL MÁS COMUNES SON:
La media aritmética: comúnmente conocida como media o promedio.
Se representa por medio de una letra M o por una X con una línea en la
parte superior.
La mediana: la cual es el puntaje que se ubica en el centro de una
distribución. Se representa como Md.
La moda: que es el puntaje que se presenta con mayor frecuencia en
una distribución. Se representa Mo.
De estas tres medidas de tendencia central, la media es reconocida como la
mejor y más útil. Sin embargo, cuando en una distribución se presentan casos
cuyos puntajes son muy bajos o muy altos respecto al resto del grupo, es
recomendable utilizar la mediana o la moda. (Porque dadas las características
de la media, esta es afectada por los valores extremos). La media aritmética es
considerada como la mejor medida de tendencia central, por las siguientes
razones: Los puntajes contribuyen de manera proporcional al hacer el cómputo
de la media. Es la medida de tendencia central más conocida y utilizada.
MEDIA ARITMÉTICA O PROMEDIO
DEFINICIÓN:
Es aquella medida que se obtiene al dividir la suma de todos los valores
de una variable por la frecuencia total. En palabras más simples,
corresponde a la suma de un conjunto de datos dividida por el número
total de dichos datos. (Kazmier & Díaz Mata)
Es el valor resultante que se obtiene al dividir la sumatoria de un
conjunto de datos sobre el número total de datos. Solo es aplicable para
el tratamiento de datos cuantitativos. ((Levin Richard & Rubin David)).
CARACTERÍSTICAS DE LA MEDIA ARITMÉTICA:
1. Es una medida totalmente numérica o sea sólo puede calcularse en
datos de características cuantitativas.
2. En su cálculo se toman en cuenta todos los valores de la variable.
3. Es lógica desde el punto de vista algebraico.
4. La media aritmética es altamente afectada por valores extremos.
5. No puede ser calculada en distribuciones de frecuencia que tengan
clases abiertas.
6. La media aritmética es única, o sea, un conjunto de datos numéricos
tiene una y solo una media aritmética.
1.12 FORMULA
Dónde:
n= Media Aritmética Muestral
Xi = Valor Típico Especifico
N = Tamaño De La Muestra
Σ = sumatoria.
FORMAS DE CÁLCULO:
Ejemplo 1:
En matemáticas, un alumno tiene las siguientes notas:
4, 7, 7, 2, 5, 3 n = 6 (número total de datos)
La media aritmética de las notas de esa asignatura es 4,8. Este número
representa el promedio.
Ejemplo 2: Cuando se tienen muchos datos es más conveniente agruparlos en
una tabla de frecuencias y luego calcular la media aritmética. El siguiente
cuadro con las medidas de 63 varas de pino lo ilustra.
Largo (en m) Frecuencia absoluta Largo por Frecuencia absoluta
5 10 5 . 10 = 50
6 15 6 . 15 = 90
7 20 7 . 20 = 140
8 12 8 . 12 = 96
9 6 9 . 6 = 54
Frecuencia total = 63 430
Se debe recordar que la frecuencia absoluta indica cuántas veces se repite
cada valor, por lo tanto, la tabla es una manera más corta de anotar los datos
(si la frecuencia absoluta es 10, significa que el valor a que corresponde se
repite 10 veces).
1.13 MEDIANA (MED)
1.14 DEFINICIÓN:
La mediana solamente establece el valor que se encuentra utilizando la
posición central dentro del conjunto. (file:/A|/tendencentral.htm)
Es el valor central de un conjunto de valores ordenados en forma
creciente o decreciente. Dicho en otras palabras, la Mediana
corresponde al valor que deja igual número de valores antes y después
de él en un conjunto de datos agrupados. Según el número de valores
que se tengan se pueden presentar dos casos: ((Webster).
Si el número de valores es impar, la Mediana corresponderá al valor central de
dicho conjunto de datos.
Si el número de valores es par, la Mediana corresponderá al promedio de los
dos valores centrales (los valores centrales se suman y se dividen por 2).
1.15 CARACTERÍSTICAS DE LA MEDIANA
1. En su cálculo no se incluyen todos los valores de la variable.
2. La Mediana no es afectada por valores extremos.
3. Puede ser calculada en distribuciones de frecuencia con clases abiertas.
4. No es lógica desde el punto de vista algebraico.
FORMULA:
Me= Li+ n/2 –FA
ni (i)
1.16 FORMAS DE CÁLCULO
La forma más general de calcular la mediana es la siguiente:
1.17 Mediana Para Datos No Agrupados:
Los datos no agrupados son aquellos que no tienen una ordenación previa para
presentarlos; por ello, se debe realizar lo siguiente:
a. Con los datos recogidos se procede a ordenarlos de manera ascendente
o descendente
b. Establece el dato que ocupa la posición central
c. Identificar el valor del dato que ocupa la posición central que vendría a
ser el valor mediano.
En este caso para encontrar el dato que ocupa la posición central debemos
identificar si se trata de un número de datos par o impar. Si se trata de datos
pares, haremos lo siguiente: Me=10/2
Con cuyo resultado contaremos la posición desde el valor menor y desde el
valor mayor, por ejemplo, si tenemos los siguientes datos: 6, 9, 3, 7, 4, 8, 6, 9,
1, 2
Procedemos a ordenarlos: 1, 2, 3, 4, 6, 6, 7, 8, 9, 9, luego identificamos la
posición que ocupa el valor central: M=5
Significa que desde el valor menor ubicamos el dato número 5, que para el
caso es el valor 6, luego hacemos lo mismo desde el valor mayor y en este
caso la posición 5 está ocupada por el valor 6. Posteriormente establecemos el
promedio entre los valores encontrados y estamos encontrando el valor
mediano: Me=6+6/2 M=6
Por tanto 6 es el valor que se encuentra ocupando la posición central o el valor
que divide en dos partes iguales al conjunto.
Si se trata de datos impares, entonces encontramos la posición, haciendo lo
siguiente: Me= n+1/ 2
Supongamos los siguientes datos: 5, 8, 3, 9, 1, 5, 7, 3, 8, 6, 4.
Procedemos a ordenar los datos: 1, 3, 3, 4, 5, 5, 6, 7, 8, 8, 9
Ahora establecemos el dato que ocupa la posición central Me= n+1/ 2
Me=11+1/2 M=6
Identificamos el sexto valor, aquí no hay problema empezar por el menor o por
el mayor puesto que será un solo valor: 1, 3, 3, 4, 5, 5, 6, 7, 8, 8, 9.
Por simple observación llegamos a determinar que el valor mediano es:
Me= n+1/ 2 M=5
1.18 Mediana Para Datos Agrupados:
Para datos agrupados en una tabla de distribución de frecuencias, vamos a
llevar el siguiente procedimiento:
a. Con la tabla de distribución de frecuencias, encontramos la frecuencia
acumulada.
b. Establecemos el dato que se encuentra ocupando la posición central.
Para ello utilizamos la siguiente fórmula:
c. Identificamos el intervalo mediano a través de la frecuencia acumulada y
la posición encontrada.
d. Aplicamos la fórmula de la mediana que es la siguiente:
Me= Li+ n/2 – fa(i)
Ni
Dónde:
Li = límite real inferior del intervalo mediano.
n= número total de observaciones.
FA= frecuencia acumulada anterior al intervalo mediano.
ni = frecuencia absoluta simple del intervalo mediano.
i = tamaño o anchura del intervalo de clase.
Ejemplo 1
Realicemos el cálculo de la mediana en el siguiente ejercicio:
Me= 241+1/2
Me=121
Aplicamos la fórmula para encontrar el valor mediano:
Me= Li+ n/2 – fa (i) / ni
Me= 43.5
1.19 Ejemplo 2:
El siguiente conjunto de datos está ordenado en forma decreciente, de mayor a
menor, y corresponde a un conjunto de valores pares, por lo tanto, la Mediana
será el promedio de los valores centrales.
21, 19, 18, 15, 13, 11, 10, 9, 5, 3
Ejemplo 3:
Lo cual significa que la mediana se ubica en la posición intermedia entre los
alumnos 25 y 26 (cuyo promedio es 25,5), lo cual vemos en el siguiente cuadro:
TABLA:
PUNTAJE ALUMNOS
62 1
62 2
62 3
62 4
62 5
67 6
67 7
67 8
67 9
67 10
72 11
72 12
72 13
72 14
72 15
72 16
72 17
72 18
77 19
77 20
77 21
77 22
77 23
77 24
77 25
77 26
77 27
77 28
77 29
77 30
82 31
82 32
82 33
82 34
82 35
82 36
82 37
82 38
82 39
82 40
82 41
82 42
82 43
82 44
82 45
82 46
87 47
87 48
87 49
87 50
El alumno 25 obtuvo puntaje de 77
El alumno 26 obtuvo puntaje de 77
Entonces, como el total de alumnos es par debemos promediar esos puntajes:
Mediana= 77+77/2 = 144/2 =77
La mediana es 77, lo cual significa que 25 alumnos obtuvieron puntaje desde
77 hacia abajo (alumnos 25 hasta el 1 en el cuadro) y 25 alumnos obtuvieron
puntaje de 77 hacia arriba (alumnos 26 hasta el 50 en el cuadro).
2 MODA
DEFINICIÓN.- Es la medida que indica cual dato tiene la mayor frecuencia en
un conjunto de datos; o sea, cual se repite más. Es el valor que se presenta
con mayor frecuencia en un conjunto de datos. A una distribución que tiene una
sola moda se le denomina un modal. Para un conjunto de datos poco
numerosos, en los que no se repite ningún valor, no existe moda. Cuando dos
valores no adyacentes tienen frecuencias máximas similares, se dice que la
distribución es bimodal. A las distribuciones de mediciones que tienen varias
modas se le denomina multimodales. ((Kazmier & Díaz Mata))
El valor que más a menudo se repite en un conjunto de datos. Está
representado por el punto más alto de la curva de distribución de un conjunto
de datos”. ((Levin Richard & Rubin David, 1996:p.140).)
2.1 CARACTERÍSTICAS DE LA MODA.
1. En su cálculo no se incluyen todos los valores de la variable.
2. El valor de la moda puede ser afectado grandemente por el método de
designación de los intervalos de clases.
3. No está definida algebraicamente.
4. Puede ser calculada en distribuciones de frecuencia que tengan clases
abiertas.
5. No es afectada por valores extremos.
2.2 FORMAS DE CÁLCULO:
Para datos no agrupados, por simple observación se puede determinar el valor
o los valores de la moda, si es que existieran.
Si tenemos los siguientes valores: 4, 5, 7, 5, 8, 1, 3, 5, 6, 8, 5
Procedemos a ordenarlos para mayor facilidad de observación: 1, 3, 4, 5, 5, 5,
5, 6, 7, 8, 8.
En este caso el valor modal es 5 porque es el que se repite el mayor número
de veces en este grupo. Para el caso de datos agrupados en una serie
ordenada de frecuencias, se considera únicamente la mayor frecuencia y el
valor de la variable será el valor modal.
a) Cuando trabajamos con datos agrupados en una tabla de distribución de
frecuencias, deberemos considerar los siguientes pasos:
b) Considerar el intervalo que mantiene la frecuencia absoluta simple más
alta, lo que sería intervalo modal.
c) Determinar la diferencia entre la frecuencia del intervalo modal y del pre
modal.
d) Determinar la diferencia entre la frecuencia del intervalo modal y del post
moda
2.3 DATOS AGRUPADOS:
1= Es el exceso de frecuencia de la clase modal con respecto a la clase
contigua anterior a ella.
2= Posterior a ella.
INTERVALO fi
28-38 2
38-48 7
48-58 7
58-68 14
68-78 15
78-88 8
88-98 3
2.4 CUARTILES
Los cuartiles son los tres valores de la variable que dividen a un conjunto de
datos ordenados en cuatro partes iguales.
Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75%
de los datos.
Q2 Coincide con la mediana.
2.5 CÁLCULO DE LOS CUARTILES
1. Ordenamos los datos de menor a mayor.
2. Buscamos el lugar que ocupa cada cuartil mediante la expresión
. K*N/ 4, K=1, 2,3
Número impar de datos
2, (Q1)
5, (Q2)
3, (Q3)…. 6, 7, 4, 9
Número par de datos
2, 5,3, 4, 6, 7,1, 9
2.6 CÁLCULO DE LOS CUARTILES PARA DATOS AGRUPADOS
En primer lugar buscamos la clase donde se encuentra,
en la tabla de las frecuencias acumuladas.
2.7 EJERCICIOS DE CUARTILES
Calcular los cuartiles de la distribución de la tabla:
DATOS fi Fi
[50, 60) 8 8
[60, 70) 10 18
[70, 80) 16 34
[80, 90) 14 48
[90, 100) 10 58
[100, 110) 5 63
[110, 120) 2 65
TOTAL 65
1. Cálculo del primer cuartil
2. Cálculo del segundo cuartil
3. Cálculo del tercer cuartil
DECILES
Los deciles son los nueve valores que dividen la serie de datos en diez
partes iguales. ((Kazmier & Díaz Mata, 1993:)
Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de
los datos D5 coincide con la mediana. (((Masson /Lind /Marchal))
CÁLCULO DE LOS DECILES
En primer lugar buscamos la clase donde se encuentra, en la tabla de las
frecuencias acumuladas.
EJERCICIO DE DECILES
Calcular los deciles de la distribución de la tabla:
DATOS fi Fi
[50, 60) 8 8
[60, 70) 10 18
[70, 80) 16 34
[80, 90) 14 48
[90, 100) 10 58
[100, 110) 5 63
[110, 120) 2 65
TOTAL 65
1. Cálculo del primer decil
2. Cálculo del segundo decil
3. Cálculo del tercer decil
4. Cálculo del cuarto decil
5. Cálculo del quinto decil
6. Cálculo del sexto decil.
7. Cálculo del séptimo decil
8. Cálculo del octavo decil
9. Cálculo del noveno decil
PERCENTILES
Los percentiles son los 99 valores que dividen la serie de datos en 100
partes iguales. (http://www.monografia.com/estadistica).
Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de
los datos. (http://www.monografias.shtml)
P50 coincide con la mediana.
Cálculo de los percentiles
En primer lugar buscamos la clase donde se encuentra, en la tabla de las
frecuencias acumuladas.
EJERCICIO DE PERCENTILES
Calcular el percentil 35 y 60 de la distribución de la tabla:
DATOS fi Fi
[50, 60) 8 8
[60, 70) 10 18
[70, 80) 16 34
[80, 90) 14 48
[90, 100) 10 58
[100, 110) 5 63
[110, 120) 2 65
TOTAL 65
1. Percentil 35
2. Percentil 60
ORGANIZADOR GRAFICO DE LAS MEDIDAS DE TENDENCIA CENTRAL
Medios de Tendencia Central
Es el número que más se repite
en 1 distribución de frecuencias
C
Valor promedio
Central
Moda
Valor promedio
Central
Media Aritmética Mediana
Son los valores centrales de
una serie de datos que se
desea investigar.
NIVELES DE LOGRO ACTIVIDADES
MEDIADO AUTÓNOMO
TEÓRICO BÁSICO Análisis de las medidas de tendencia central en el Aula
Lectura comprensiva de frecuencias y de las medidas de tendencias Central
consulta de las medidas de tendencia central mediante la aplicación de las TIC´S
lectura comprensiva de los conceptos de las medidas de tendencia central
TEÓRICO SUPERIOR Análisis de la realización de las tablas de frecuencias con datos agrupados y datos no agrupados
Toma de decisiones para realizar los ejercicios con la aplicación de las Medidas de tendencia central
Aplicación de los ejercicios propuestos
Realización de consultas de todos los conceptos básicos
TEÓRICO PRÁCTICO
ACEPTABLE
Aplicación en ejercicios de la teoría analizada
Formulación de alternativas de solución
Realización de ejercicios
Elaboración de mente factos y lectura comprensiva
TEÓRICO PRÁCTICO
AVANZADO
Análisis de los problemas que suceden en la
sociedad.
Aplicación de ejercicios con datos reales del Banco Central
del Ecuador.
CAPITULO II
MEDIDAS DE DISPERSIÓN
Es la diferencia entre dos valores seleccionados del conjunto de datos
Comprendemos pues, a la vista de estos ejemplos, la necesidad de
conocer otras medidas, aparte de los valores de centralización, que nos
indiquen la mayor o menor desviación de cada observación respecto de
aquellos valores. Las medidas de desviación, variación o dispersión son:
Rango o amplitud, desviación media y desviación típica. ((Webster)
También conocidas como medidas de variabilidad. En contraste, estas
medidas se encargan de describir la variabilidad entre los valores”
((Kazmier & Díaz Mata,)
2.8 RANGO, AMPLITUD TOTAL O RECORRIDO
2.9 DEFINICION
Diferencia entre el valor observado más alto y el más pequeño. ((Masson
/Lind /Marchal, 2000: p.106).)
El rango se suele definir como la diferencia entre los dos valores
extremos que toma la variable. Es la medida de dispersión más sencilla y
también, por tanto, la que proporciona menos información. Además, esta
información puede ser errónea, pues el hecho de que no influyan más de
dos valores del total de la serie puede provocar una deformación de la
realidad. La amplitud total o rango se define como la diferencia entre el
valor máximo y el valor mínimo de un conjunto de datos. Cuando la
variable sea continua, para el cálculo deben utilizarse los límites exactos.
(http://www.monografia.com/estadistica)
2.10 CARACTERÌSTICAS
2.11 Características del Rango
1. Es fácil de calcular.
2. Es comúnmente usado como una medida eficaz de variabilidad.
3. Es comprensible para cualquier persona, aún cuando no conozca de
estadística.
2.12 FORMULA
Dónde:
X máx = Valor máximo
X mín = Valor mínimo
r = rango
2.13 FORMAS DE CÁLCULO.
Comparemos, por ejemplo, estas dos series:
Serie 1: 1 5 7 7 8 9 9 10 17
Serie 2: 2 4 6 8 10 12 14 16 18
Ambas series tienen rango 16, pero están desigualmente agrupadas, pues
mientras la primera tiene una mayor concentración en el centro, la segunda
se distribuye uniformemente a lo largo de todo el recorrido.
El uso de esta medida de dispersión, será pues, bastante restringido.
3 LA VARIANZA
3.1 DEFINICION
El valor de la varianza, desde el punto de vista práctico, es un poco
complicado de entender, porque las unidades asignadas a ellas son
cuadradas, tales como metros cuadrados. Para convertir esta medida de
variabilidad en unidades originales, podemos tomar la raíz cuadrada de la
varianza (S2), obteniendo la desviación estándar de una muestra. La
desviación estándar sirve como medida básica de variabilidad.
“La varianza es la media aritmética de los cuadrados de las desviaciones de
las observaciones respecto de su media aritmética. Es una medida
importante de dispersión”. ((Webster) ((Webster, 2000: p. 72).)
La varianza es similar a la desviación media, porque se basa en la diferencia
entre cada uno de los valores del conjunto de datos y la media del grupo. La
diferencia consiste en que, antes de sumarlas se eleva al cuadrado cada una
de las diferencias. Para una población, se presenta la varianza mediante v
(x) o, en forma más típica mediante la letra σ² (que se lee “sigma cuadrado”).
((Kazmier & Díaz Mata, 1993:)
FORMULA:
POBLACIÓN
Dónde:
N= total de observaciones de la población
Xi= variable
μ = media poblacional
σ ²= varianza
MUESTRA
Dónde:
n= tamaño de la muestra
Xi= valores de la muestra
= media muestral
S2 = varianza
3.2 FORMA DE CÁLCULO
El número de días necesarios por 10 equipos de trabajadores para terminar
10 instalaciones de iguales características han sido: 21, 32, 15, 59, 60, 61,
64, 60, 71, y80 días. Calcular la varianza.
Solución: Se suman todos los valores de una variable dividida entre el
número total de datos de los que se dispone:
Luego, se toman todos los valores dados y la media obtenida, se sustituye
en la fórmula de la varianza.
σ ²= 427,61
3.3 DESVIACIÓN MEDIA
3.4 DEFINICIÓN
Es la medida de dispersión más importante, ya que se emplea como una
medida para comparar la dispersión en dos o más conjuntos de
observaciones”. ((Masson /Lind /Marchal, 2000: p.106).)
La desviación típica de un conjunto de datos es una medida de cuánto se
desvían los datos de su media. Esta medida es más estable que el recorrido
y toma en consideración el valor de cada dato. También se puede decir que
es la raíz cuadrada de la varianza. (((Masson /Lind /Marchal))
Puede definirse como la media aritmética de las desviaciones de cada uno
de los valores con respecto a la media aritmética de la distribución, y de
indica así:
N
xxDM
Nótese que se toman las desviaciones en valor absoluto, es decir, que la
fórmula no distingue si la diferencia de cada valor de la variable con la media
es en más o en menos. Ya se habrá advertido que esta expresión sirve para
calcular la desviación media en el caso de datos sin agrupar. Se tiene los
valores 2, 2, 4, 4, 5, 6, 7, 8, 8. Averiguar la desviación media de estos
valores.
X xx x
2 -3 3
2 3 3
4 -1 1
4 -1 1
4 -1 1
5 0 0
6 1 1
7 2 2
8 3 3
8 3 3
DM = 1,8 Veamos ahora cómo se calcula la desviación media en el caso de
datos agrupados en intervalos.
N
xnDM
i
Donde observamos que ahora las desviaciones van multiplicadas por las
frecuencias de los intervalos correspondientes. Además, las desviaciones
son de cada centro, o marca de clase, a la media aritmética. Es decir,
N
xxnDM
mi )(
Ejemplo: Para hallar la desviación media de la siguiente tabla referida a las
edades de los 100 empleados de una cierta empresa:
Clase ni
16-20 2
20-24 8
24-28 8
28-32 18
32-36 20
36-40 18
40-44 15
44-48 8
48-52 3
Veamos cómo se procede:
Marca de
Clase
ni xm ni xm xx ni xx
16-20 2 18 36 16,72 33,44
20-24 8 22 176
24-28 8
28-32 18
32-36 20
36-40 18
40-44 18
44-48 8
48-52 3
100
DM = 6,09
La desviación media viene a indicar el grado de concentración o de
dispersión de los valores de la variable. Si es muy alta, indica gran
dispersión; si es muy baja refleja un buen agrupamiento y que los valores
son parecidos entre sí.
3.5 DESVIACIÓN TÍPICA
Es sin duda la medida de dispersión más importante, ya que además sirve
como medida previa al cálculo de otros valores estadísticos.
La desviación típica se define como la raíz cuadrada de la media de los
cuadrados de las desviaciones con respecto a la media de la distribución.
Es decir,
N
xxS
2
Para datos sin agrupar, o bien:
N
xxS
2
3.6 CÁLCULO DE LA DESVIACIÓN TÍPICA PARA DATOS NO
AGRUPADOS EN CLASES
Veamos la fórmula anterior aplicada a un caso concreto.
Hallar la desviación típica de la serie: 5, 8, 10, 12, 16.
X xx xx2
5 -5,2 27,04
8 -2,2 4,84
10 -0,2 0,04
12 1,8 3,24
16 5,8 33,64
Primero hallamos x = 10,2
Luego S = 71,376,13
3.7 CÁLCULO DE LA DESVIACIÓN TÍPICA PARA DATOS
AGRUPADOS EN CLASES Y AGRUPADOS POR FRECUENCIAS
a) Método largo: Se aplica la siguiente fórmula
N
fxS
2
Donde xxx m y f es la frecuencia absoluta de cada intervalo.
b) Método abreviado o corto: La fórmula a utilizar es:
22
N
fd
N
fdIS
Dónde:
I : amplitud de la clase
D: distancia en clases desde cada una en concreto a la clase que contiene a
la media supuesta A.
Ejemplo: Las alturas en cm de un grupo de 103 personas se distribuyen así:
Clases f
150 – 155
155 – 160
160 – 165
165 – 170
170 – 175
175 – 180
180 – 185
185 – 190
190 – 195
195 – 200
3
6
12
18
25
17
10
7
4
1
103
Respuesta: S = 9,56
4 PASOS PARA DESCARGAR E INSTALAR EL SPSS
1. Prender el computador
2. Descargar el programa SPSS
3. Entrar en la página 4 shared
4. Clic en archivos y poner el nombre del programa y buscar
5. Clic en descargar SPSS
6. Clic en descargar archivo esperar algunos segundo
7. Clic en descargar archivo
8. Asegurarse de no estar conectado a internet: durante la instalación el
programa
Para desconectar el acceso a la red hacer clic en Inicio
9. Panel de control
10. Conexiones de red.
11. Luego hacer clic con el botón secundario del mouse en el ícono de la
placa de red y hacer clic en "Desactivar".
12. ) Ir a la carpeta donde se ubica el archivo "SPSS 17 Setup.exe" y
hacer doble clic en el mismo.
13. Se abrirá una ventana que muestra el progreso de la instalación.
14. Se abre otra ventana. Seleccionar "Licencia de usuario individual" y
hacer clic en "Siguiente >". En la siguiente ventana hacer clic en
"Acepto los términos del contrato de licencia" y hacer clic en
"Siguiente >". En la ventana de "Información de última hora" hacer clic
en "Siguiente >".
15. Se abre una nueva ventana
a) Completar los campos "Nombre de usuario" y "Organización" con
los datos que se desee.
b) Ir a la carpeta donde se ubica el archivo "keygen.exe" y hacer
doble clic en el mismo.
c) Atención: antes de continuar, tener en cuenta que los códigos
mostrados aquí pueden diferir de los que muestra el programa en
su computadora (se recomienda utilizar solamente los códigos
mostrados en el programa que se utiliza al instalar y no los
mostrados aquí
16. Se abre una ventana para ingresar licencia y registro de SPSS. Hacer
clic en "Aceptar".
17. Se abre una nueva ventana. Seleccionar "Conseguir una licencia para
mi producto ahora".
18. Clic en siguiente
19. Introducir el código de autorización que está debajo del botón
"Generate" del keygen mencionado en 5b. Hacer clic en "Siguiente >".
Aparece una ventana que indica un error en la conexión a internet.
Hacer clic en "Siguiente >".
20. Clic en siguiente para que se instale el programa
21. Luego clic en inicio programas spss Aparece una ventana que indica
las licencias de las que se dispone. Hacer clic en "Siguiente >".
22. Se abre una nueva ventana. Seleccionar "Conseguir una licencia
para mi producto ahora".
23. Luego se introduce la licencia del producto
24. Clic en siguiente
25. Para pasar el idioma del programa a español
26. Abrir un archivo .sav o alguno de la carpeta Samples.
En el menú "Edit" hacer clic en el botón "Options..." En la pestaña
"General", en el área "Output", en la sección "Language" hacer clic la lista
desplegable (el triángulo que apunta hacia abajo) y hacer clic en
"Spanish".
Repetir el paso 19 en la sección "User Interface" y hacer clic en "OK".
27. Para reconectar el acceso a la red hacer clic en Inicio / Panel de
control / Conexiones de red. Luego hacer clic con el botón secundario
del mouse en el ícono de la placa de red y hacer clic en "Activar".
4.1 PASOS PARA RESOLVER EL CASO EN SPSS:
1. Inicio/Programs/SPSS 17 for Windows/SPSS Para Windows.
2. Hacemos clic en la opción “Introducir datos” de la ventana de Bienvenida y
aceptamos.
3. Seleccionamos en la parte inferior de la ventana la opción “Vista de
Variables”, y procedemos a crear una variable
4. En la parte inferior de la ventana seleccionamos la opción “Vista de
datos”, en la columna donde vemos el nombre de la variable procedemos a
ingresar los datos al azar.
5. Para ordenar los datos ya sea en forma ascendente o descendente:
Datos/Ordenar casos.
6. En esta ventana seleccionamos la variable y la trasladamos haciendo clic
en la flecha de color negro.
7. Una vez que hemos trasladado la variable, seleccionamos el Orden de
clasificación (en este caso Descendente) y aceptamos.
8. En la ventana principal de SPSS, observamos que los datos se
encuentran ordenados de tal forma (de mayor a menor).
9. Para la obtención de Intervalos: Transformar/Recodificar/En distintas
variables…
10. En la ventana “Recodificar en distintas variables”, trasladamos la variable
“Exportaciones de Girasol” haciendo clic en la flecha de color negro.
11. En la opción “Variable de resultado” debemos colocar distintos nombres
en las casillas de Nombre y Etiqueta.
12. Hacemos clic en la opción “Cambiar” y posteriormente en la opción
“Valores antiguos y nuevos…”.
13. Dentro de la ventana “Recodificar en distintas variables: Valores antiguos
y nuevos”, escogemos la opción “Rango:” iremos ingresando los intervalos,
además hemos de marcar la opción “Las variables de resultados son
cadenas” y colocamos una cantidad (20), en la opción “Valor nuevo”
volveremos a ingresar los intervalos y los iremos añadiendo (opc. Añadir)
hasta terminar.
14. Aquí nos presentan ya los datos de los intervalos ingresados en su
totalidad.
15. Hacemos clic en la opción “Continuar” y tendremos en la Ventana
principal de SPSS los datos en forma de intervalo.
16. Para desarrollar las distintas actividades estadísticas:
Analizar/Estadísticos descriptivos/Frecuencias…
17. Dentro de la ventana “Frecuencias”, seleccionamos la Variable
“Exportaciones de Girasol” y la trasladamos haciendo clic en la flecha de
color negro.
18. Posteriormente hacemos clic en la opción “Estadísticos”.
19. Ya en la ventana “Frecuencias: Estadísticos”, marcamos todas las
operaciones estadísticas que necesitemos y hacemos clic en “Continuar”.
20. De retorno en la ventana “Frecuencias”, hacemos clic en la opción
“Gráficos”, seleccionamos la mejor gráfica y Hacemos clic en la opción
“Continuar”.
Gráficos histogramas.
21. Nuevamente en la ventana “Frecuencias”, hacemos clic en la opción
“Aceptar” y podremos visualizar los resultados finales.
5 ORGANIZADOR GRAFICO DE LAS MEDIDAS DE DISPERSIÓN
Medidas de Dispersión
Son aquellas medidas que se
encuentran alejadas del centro de
una distribución de frecuencias.
Rango Desviación
Media
Desviación
Típica
Varianza
NIVELES DE LOGRO ACTIVIDADES
MEDIADO AUTÓNOMO
TEÓRICO BÁSICO Análisis de las medidas dispersión.
Lectura comprensiva de las medidas de dispersión
consulta de las medidas de dispersión mediante la aplicación de las TIC´S
Lectura comprensiva de los conceptos de las medidas de dispersión
TEÓRICO SUPERIOR Análisis de la realización de las medidas de dispersión con datos agrupados y datos no agrupados
Toma de decisiones para realizar los ejercicios con la aplicación de las Medidas de dispersión
Aplicación de los ejercicios propuestos
Realización de consultas de todos los conceptos básicos
TEÓRICO PRÁCTICO ACEPTABLE Aplicación en ejercicios de la teoría analizada y conocimiento del programa spss para la aplicación de las medidas de tendencia central.
Formulación de alternativas de solución.
Realización de ejercicios a través del programa SPSS
Elaboración de mente factos y lectura comprensiva
TEÓRICO PRÁCTICO AVANZADO Análisis de los problemas que suceden en la sociedad.
Aplicación de ejercicios con datos reales de la Banco central del Ecuador
CAPITULO III
5.1 TEMA: MUESTREO
Existen estudios en el que queremos conocer ciertas características de un
grupo de personas o autos a los que llamaremos población de manera que no
se los puede estudiar a todos porque son numerosos o porque su naturaleza se
vuelve inaccesible, existe otro recurso que es estudiar una parte que se llama
MUESTRA, generalmente cuando el n>100 se lo llama población pero si n<100
a toda la población se la puede llamar muestra.
Se puede estudiar el muestreo estadístico y el muestreo no estadístico en que
el primero se lo escoge completamente al azar sin ninguna instrucción
predeterminada en cambio el segundo tiene una instrucción al seleccionar los
elementos de la muestra.
MUESTRA
DEFINICION
Una muestra es un conjunto de medidas u observaciones tomadas a partir de
una población dada; es un subconjunto de la población. Desde luego, el
número de observaciones en una muestra es menor que el número de posibles
observaciones en la población, de otra forma, la muestra será la población
misma. Las muestras se toman debido a que no es factible desde el punto de
vista económico usar a toda la población. En algunos casos es imposible
recolectar todas las posibles observaciones en la población.
http://www.vitutor.com/estadistica/descriptiva/a_1.html
Una muestra es un conjunto de medidas u observaciones tomadas a partir de
una población dada; es un subconjunto de la población. Desde luego, el
número de observaciones en una muestra es menor que el número de posibles
observaciones en la población, de otra forma, la muestra será la población
misma. Las muestras se toman debido a que no es factible desde el punto de
vista económico usar a toda la población. En algunos casos es imposible
recolectar todas las posibles observaciones en la población.
http://www.vitutor.com/estadistica/descriptiva/a_1.html
EJEMPLO
Si se desea estimar el gasto promedio anual de los estudiantes del
C.B., se extraería una muestra formada por cierto número de
estudiantes, se determinaría el gasto anual correspondiente a cada
uno de ellos y después se obtendría el promedio. Se utiliza una
muestra debido a que simplemente no se tiene el tiempo ni el recurso
para establecer el contacto con todos los estudiantes del C.B., aun
cuando es posible hacerlo.
5.2 MUESTREO PROBABILÍSTICO:
Aleatorio: Asigna un número a cada uno, selecciona la muestra a través de
números aleatorios.
El procedimiento empleado es el siguiente: 1) se asigna un número a cada
individuo de la población y 2) a través de algún medio mecánico (bolas dentro
de una bolsa, tablas de números aleatorios, números aleatorios generados con
una calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario
para completar el tamaño de muestra requerido. Este procedimiento, atractivo
por su simpleza, tiene poca o nula utilidad práctica cuando la población que
estamos manejando es muy grande. ((Kazmier & Díaz Mata,)
Muestreo en el que todas las muestras tienen la misma probabilidad de ser
seleccionadas y en el que las unidades obtenidas a lo largo del muestreo se
devuelven a la población. 2) Muestreo en el que la muestra aleatoria está
formada por variables aleatorias independientes e idénticamente distribuidas a
la variable aleatoria poblacional. Sinónimo de Muestreo aleatorio con
reemplazamiento. http://www.mitecnologico.com/
5.3 Sistemático: Lista completa del universo selecciona cada individuo cada
10 individuos.
Se practica cuando se dispone de una lista de todas las unidades
Muéstrales, en un orden independiente de la variable que se desea
medir. http://www.jorgegalbiati.cl/ejercicios_4/ConceptosBasicos.pdf
Se elige un individuo al azar y a partir de él, a intervalos constantes, se
eligen los demás hasta completar la muestra.
http://www.vitutor.com/estadistica/inferencia/inferenciaContenidos.html
5.4 Estratégico: Son tamaños de la muestra de cada extracto depende de
los necesidades.
Muestreo en el que la población se divide previamente en un número de
subpoblaciones o estratos, prefijado de antemano. Dentro de cada estrato se
realiza un muestreo aleatorio simple. (http://www.AulaFacil.com,
http://www.AulaFacil.com)
Este muestreo considera categorías típicas diferentes entre sí (estratos) que
poseen gran homogeneidad respecto a alguna característica (se puede
estratificar, por ejemplo, según la profesión, el municipio de residencia, el sexo,
el estado civil, etc.). Lo que se pretende con este tipo de muestreo es
asegurarse de que todos los estratos de interés estarán representados
adecuadamente en la muestra. Cada estrato funciona independientemente,
pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el
estratificado para elegir los elementos concretos que formarán parte de la
muestra. En ocasiones las dificultades que plantean son demasiado grandes,
pues exige un conocimiento detallado de la población. (Tamaño geográfico,
sexos, edades, etc. (muestra. http:// www.wikipedia.)
5.5 MUESTREO NO PROBABILÍSTICO:
5.6 Casual: Entrevista a los individuos en forma casual (Ejemplo: lo que
pasan por la calle).
Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la población.
http://maxsilva.bligoo.com
Se usa en los casos en no es posible seleccionar los elementos, y deben
sacarse conclusiones con los elementos que estén disponibles
http://sitios.ingenieria-usac.edu/teoria.html
5.7 Intencional: Selecciona al individuo según el criterio de un experto
(Ejemplo: dueños a un restaurante).
Es muy frecuente su utilización en sondeos preelectorales de zonas que
en anteriores votaciones han marcado tendencias de voto.
http://maxsilva.bligoo.com/Metodos-de-Muestreos-no-Probabilist.html
Muestreo en el que la persona que selecciona la muestra procura que
esta sea representativa; por consiguiente, la representatividad depende
de su intención u opinión, y la evaluación de la representatividad es
subjetiva. No tiene fundamento probabilístico. http://sitios.ingenieria-.html
5.8 Cuotas: Cada entrevistado debe estar dentro de cada categoría (Ejemplo:
hombres y mujeres).
También denominado en ocasiones "accidental". Se asienta
generalmente sobre la base de un buen conocimiento de los estratos de
la población y/o de los individuos más "representativos" o "adecuados"
para los fines de la investigación. http://www.psico.uniovi.es/Dptg.html
En este tipo de muestreo se fijan unas "cuotas" que consisten en un
número de individuos que reúnen unas determinadas condiciones, por
ejemplo: 20 individuos de 25 a 40 años, de sexo femenino y residentes
en Gijón. (http://www.monografias.shtml)
5.9 Determinar El Tamaño De La Muestra
Hay que tener mucho cuidado en determinar la muestra si es demasiado
grande la investigación puede existir un desperdicio de recursos si es
demasiado pequeña no lleva a tener resultados sin uso práctico.
Para determinar el tamaño de la muestra se debe tener en cuenta lo siguiente.
1. Que el objeto y objetivo de la investigación sea interesante.
2. El nivel de confiablidad con el que trabaja se recomienda el 95% ^ 99%,
significa que de 100 casos, se espera que el 95 de ellos se hallan dentro del
intervalo construido y que 5 se hallan fuera del intervalo sea a la derecha o
izquierda.
3. Las probabilidades reales de ciertas características estén presentes en la
investigación que debe variar entre (0-1) P+Q=1 Ejemplo.
P=0.5; -> Q=0.5
P=0.3; -> Q=0.7
4. El error de muestreo puede ser según el investigador que puede ser entre el
1% ^ 9% máximo es recomendable entre el 1% ^ 9% máximo es
recomendable entre el 1% ^5%.
5. Aplicar las fórmulas adecuadas para poblaciones finitas e infinitas.
Si el nivel de coeficiente es 95%.
Si el nivel de confianza es 99%.
5.10 EJEMPLOS:
1.- Se desea calcular e tamaño de la muestra que será aplicado a productos de
papas existen 4528 productores, el error o límite aceptable es del 5%.
2.-Cuando Exista La Probabilidad De Ocurrencia
P^O= probabilidad de ocurrencia.
Una empresa dedicada a la venta de artículos y accesorios para vehículos
desea conocer el grado de aceptación de sus productos entre los propietarios
de vehículos de la ciudad por lo cual se estabilicen las siguientes condiciones.
a) Nivel de confianza 95%
b) N= 46720
c) E= 4%
3.- según un departamento de una empresa consecuencia de un trauma de
coberturas desea conocer los km recorridos durante una semana.
a) El error muestra máximo no debe pasar a 20km
b) Nivel de confianza 95,44% Z=2,05
c) S= 195 km
5.11 POBLACIÓN FINITA
Es aquella que indica que es posible alcanzarse o sobrepasarse al contar.
http://www.gestiopolis.com/recursos/expertpagans/eco/44/estadistica.htm
Es aquella que posee o incluye un número limitado de medidas y
observaciones.
http://www.gestiopolis.com/recursos/experto//pagans/eco/44/estadistica.htm
1.-Suponga que el cantón de Guamote está empeñado en recibir un proyecto
para que sus habitantes tengan acceso a la salud, con las siguientes
condiciones:
X= 95%; z= 1,96
S= Varianza (0,4)2
E =5%
n= (0,4)
n = (1,96)2(0,4)2
(0,05)2
n = 246 viviendas
2.-El gerente de una estación de televisión quiere calcular el porcentaje de
personas que hay en un determinado programa se pide una muestra que le
somete a una encuesta con las siguientes condiciones;
a) E= 3%
b) = 99%
c) La proporción de personas que presume que miran el programa se
estima en el 65%
n = 1683
3.-El cantón Espejo tiene 15614 habitantes se dedica a investigar sobre la
aceptación para la ordenanza municipal. Para dicha investigación se encarga la
UPEC aplicando una encuesta. A pedido del Alcalde de la localidad, el error
máximo es de 2,5%
n = 1451
6 CAMPANA DE GAUS
6.1 Ejemplos de la campana de GAUS:
6.2 1.) Calcular La Probabilidad Del Evento
P (-2.8 Z 0)
P= 0.4974
P= 49.74%
DESARROLLO
a) P (-3.6 Z 0) Z = -3.6
P= 0.4998
P= 49.98%
b)P (-2.02 Z 0) Z = -2.02
P= 0.4783
P= 43.83%
C) P (-1.4 Z 0) Z = -1.4
P= 0.4192
P= 41.92%
6.3 2.) Calcular La Probabilidad Del Evento
P (1.02 Z 2.97)
1.02 y 2.96= A (0^2.97)- A (0^1.02)
= 0.4985 – 0.3461
= 0.1524
=15.24%
6.4 DESARROLLO
a) P (0.5 Z 1.09)
0.5 y 1.09 = A (0^1.09)- A
(0^0.5)
= 0.3621- 0.1915
= 0.1706
=17.06%
b) P (2.04 Z 3.16)
0.5 y 3.16 = A (0^3.16)- A
(0^0.5)
= 0.4992-0.4793
= 0.0199
=01.99%
c) P (1.84 Z 1.96)
1.84 y 1.96= A(0^1.96)- A
(0^1.84)
= 0.4750– 0.4671
= 0.1524
=00.79%
3.) Calcular La Probabilidad Del Evento
P (-3.5 Z -3.08)
A (-3.5 ^ - 3.08)= A (-3.5^0) - A (-3.08 ^0)
= 0.4998-0.4990
= 0.0008= 00.08%
DESARROLLO
a) P (--2.36 Z -1.43)
A (-2.36 ^ - 1.43)= A (-2.36 ^0) - A (--1.43
^0)
= 0.4909-0.4236
= 0.0673 = 06.73%
b) P (-1.75 Z -0.45)
A (-1.75 ^ - 0.45)= A (-1.75 ^0) - A (-0.45^0)
= 0.4599 -0.1736
= 0.2863= 28.63%
4) Calcular la probabilidad del evento
P (-1.03 A 2.94)
P (-1.03 Z 2.94)
A (-1.03 ^ 2.94)= A (-1.03 ^ 0) + A (0 ^ 2.94)
= 0.3485 + 0.4984
= 0.8469=84.69%
DESARROLLO
a) P (-0.5 Z 12.76)
A (-0.5 ^ 16.76)= A (-0.5 ^ 0) + A (0 ^ 12.76)
= 0.1915+0.4971
= 0.6886 =68.86%
a) P (-0.2 Z 1.01)
A (-0.2 ^ 1.01)= A (-0.2 ^ 0) + A (0 ^ 1.01)
= 0.0793 + 0.3438 +0.3438
= 0.4231=42.31%
5.) Calcular La Probabilidad Del Evento
P (Z > 2.03)
A=0.5-área entre
A=0.5-0.47=0.0212
A=2.12%
DESARROLLO
a) P (Z >1.96)
A=0.5-área entre 1.96
A=0.5-0.4750=0.025
A=2.5%
a) P (Z >2.58)
A=5-área entre 2.58
A=5-0.4950=4.505
A=450.5%
a) P (Z >2.33)
A=0.5-área entre 2.33
A=1-0.4901 = 0.5099
A=50.99%
7) Calcular la probabilidad del evento.
DESARROLLO
a) P (Z < -1.96) P=0.5-0.4750 P=0.025 p=2.5%
b) P (Z < -2.58) P=0.5-0.4750 P=0.05 P=5%
7 VARIABLES
7.1 DEFINICIÓN DE VARIABLE
Una variable estadística es cada una de las características o cualidades
que poseen los individuos de una población.
Son aquellas cualidades o características que tiene un individuo o
población y puede ser medido tanto cuantitativa como cualitativamente.
http://www.e-torredebabel.com/Psicologia/Vocabulario/Variable.htm
7.2 EJEMPLO DE VARIABLES:
1. Edad de las personas
2. Nacionalidad
3. Nivel de ingresos
4. Sexo motivación
5. Color de piel
6. Nivel de ansiedad
7. Número de nacimientos
8. Estado civil
9. Peso
10. Estatura
11. Religión
7.3 CLASIFICACIÓN DE LAS VARIABLES:
a) Variable independiente
b) Variable dependiente
7.4 VARIABLE DEPENDIENTE:
En investigación, se denomina variable independiente a aquélla que es
manipulada por el investigador en un experimento con el objeto de estudiar
cómo incide sobre la expresión de la variable dependiente. A la variable
independiente también se la conoce como variable explicativa, y mientras que a
la variable dependiente se la conoce como variable explicada. Esto significa
que las variaciones en la variable independiente repercutirán en variaciones en
la variable dependiente.http://www.cx/ /var_dependientes_independientes.htm
7.5 VARIABLE INDEPENDIENTE:
Es aquella cuyo valor no depende de otra variable. Se podría decir que son
características controladas por el investigador. Los cambios en los valores de
este tipo de variables determinan cambios en los valores de otra (variable
dependiente).http://grupos.emagister.comvariables.com
EJEMPLOS:
VARIABLE INDEPENDIENTE VARIABLE DEPENDIENTE
Consumo Excesivo De Cigarrillo * Causa Enfermedades Graves
En El Ser Humano.
Mayor Demanda De Un Producto * Genera Más Producción.
Mayores Exportaciones * Generan Más Ingresos Al
País.
Menor Control En La Frontera * Causa Mayor Contrabando.
a. Variable independiente
Es aquella característica o propiedad que supone ser la causa del fenómeno
estudiado. Además es la variable que el investigador manipula.
Ejemplo:
El uso de dentífrico.
Años estudiados.
b. Variable dependiente
Es el factor que es observado y medido para determinar el efecto de la variable
independiente.
Ejemplo:
El uso de un dentífrico (v. independiente), quita o no caries (v.
dependiente).
El consumo excesivo de chocolates (v. independiente), produce caries
(v. dependiente).
Los años de estudio (v. independiente), aumenta el salario (v.
dependiente).
NIVELES DE LOGRO ACTIVIDADES
MEDIADO AUTÓNOMO
TEÓRICO BÁSICO Lectura comprensiva del muestreo y de la
determinación del tamaño de la muestra
Análisis de la Campana de Gauss
Organizador gráfico del muestreo
Consulta y lectura comprensiva de los
conceptos de muestreo
TEÓRICO SUPERIOR Análisis de la realización de las gráficas de la campana
de Gauss.
Toma de decisiones para realizar los ejercicios con la
aplicación del muestreo
Análisis de los conceptos investigados
Comprensión de lectura.
TEÓRICO PRÁCTICO
ACEPTABLE
Aplicación en ejercicios de la teoría analizada
Formulación de alternativas de solución
Aplicación de los ejercicios propuestos del
muestreo
Realización de ejercicios de la campana de
gauss
TEÓRICO PRÁCTICO
AVANZADO
Análisis de los problemas que suceden en la sociedad.
Análisis de las variables dependientes e independientes
de la sociedad.
Aplicación de ejercicios con datos reales
planteados por el docente
Investigación de ejemplos de las variables.
CAPITULO IV
7.6 TEMA: ESTADÍSTICA INFERENCIAL
Rama de la estadística que estudia el comportamiento y propiedades de las
muestras, y la posibilidad y límites de la generalización de los resultados
obtenidos a partir de aquellas a las poblaciones que representan. Esta
generalización de tipo inductivo, se basa en la probabilidad. También se le
llama también estadística matemática, por su complejidad matemática en
relación a la estadística descriptiva. (muestra. http:// www.wikipedia.)
Tiene como objetivo generalizar las propiedades de la población bajo
estudio, basado en los resultados de una muestra representativa de la
población.
Es una parte de la Estadística que comprende los métodos y procedimientos
estadísticos en los que interviene la aplicación de modelos de probabilidad y
mediante los cuales se realiza alguna afirmación sobre poblaciones con base
en la información producida por muestras para deducir propiedades (hacer
inferencias) de una población, a partir de una pequeña parte de la misma
(muestra). (http://www.Wikipedia: Estadísticas.)
7.7 CORRELACIÓN
La correlación indica la fuerza y la dirección de una relación lineal entre dos
variables aleatorias. Se considera que dos variables cuantitativas están
correlacionadas cuando los valores de una de ellas varían sistemáticamente
con respecto a los valores homónimos de la otra: si tenemos dos variables (A y
B) existe correlación si al aumentar los valores de A lo hacen también los de B
y viceversa. La correlación entre dos variables no implica, por sí misma,
ninguna relación de causalidad (http://es.correlacion-estadistica.org)
7.8 Coeficiente de correlación.- se expresa de una manera cuantitativa la
magnitud y división de una relación se la designa con la letra x puede
variar entre +1 a -1 el signo nos dice si la relación es positiva o negativa.
Como +1 es el mejor número posibles este representa una relación perfecta de
una relación positiva.
Si el coeficiente es menor a 1 que la relación es perfecta y la relación es
negativa.
Cuando la correlación es cero (0) no existe una relación entre X y Y significa
que X y no crece y dúrese la recta es horizontal.
7.9 Relación lineal.- Entre dos variables es aquella que puede
representarse en un plano cartesiano con una mayor exactitud mediante
una línea recta por la ecuación Y= bx + a
Existen diversos coeficientes que miden el grado de correlación, adaptados a la
naturaleza de los datos. El más conocido es el coeficiente de correlación de
Pearson, que se obtiene dividiendo la covarianza de dos variables por el
producto de sus desviaciones estándar.
EJEMPLOS
La tabla muestra un salario mensual que perciben 5 agentes de ventas, el valor
de dólares.
Agente
Variable
X mercancía
vendida $
Variable
salario $
X
Y
1 0 500 0 500
2 1000 900 1000 900
3 2000 1300 2000 1300
4 3000 1700 3000 1700
5 4000 2100 4000 2100
La ecuación nos indica la relación entre el salario y la
mercadería vendida, esto nos indica que Y se incrementa 0,40 por cada
unitario de X, con esta relación podemos predecir cualquier valor de Y si solo
se conoce el valor de x
Así un agente vende $ 1500 de mercancía y su salario igual a $1100
7.10 COEFICIENTE DE CORRELACIÓN DE PEARSON
Todo coeficiente de correlación que no sea cero indica cierto grado de relación
entre 2 variables, lo que el grado de intensidad es fuerte o débil de una
interpretación matemática pura, el hecha de que 2 variables tienden o
aumentan o disminuir sobre cada uno de ellos.
Matemáticamente entre dos variables r lo interpreta como
Interpretación.- que tan dorado es el coeficiente de orientación desde de r=0
indica cierto grado de relación entre 2 variables que grado.
Intensidad de relación se puede considerar si la relación es fuerte o débil.
EJEMPLO
ESTUDIANTES PRUEBA DE
HONORABILIDAD
MENTAL
EXAMEN DE AUDICIÓN
María
Olga
Susana
Aldo
Juan
18
15
12
9
3
82
68
60
32
18
7.11 Interpretación.- Que tan elevado es el coeficiente de correlación dado,
todo r ≠0 indica cierto grado de relación entre 2 variables que grado de
intensidad de relación se puede considerar si la relación es fuerte o débil.
7.12 Calcular el r de Pearson.
ESTUDIANTE COEFICIENTE INTELECTUAL
PUNTAJE
1 2 3 4 5 6 7 8 9 10 11 12
110 112 118 119 122 125 127 130 132 134 136 138
1 1.6 1.2 2.1 1.8 2.6 2
3.2 2.6 3
3.6
19 100-140 (1-4)
COEFICIENTE DE CORRELACIÓN DE RANGOS DE SPERMAN
Cuando una o más variables son solo de escala ordinal su fórmula matemática
es:
N= números de parejas de rango
María
Olga
Susana
Aldo
Juan
18
15
12
9
3
18
32
60
68
82
María
Olga
Susana
Aldo
Juan
18
15
12
9
3
18
82
68
60
32
Sujeto Orden dado
el psicólogo
A(Rxi)
Orden dado
por el
psicólogo
B(Ryi)
DI
R( xi) - (yi)
Di ²
1
2
3
4
5
6
7
8
9
10
12
6
5
7
10
2.5
2.5
9
1
11
4
8
12
5
3
4
8
1
6
10
2
9
7
11
12
1
2
3
2
1.5
3.5
1
1
2
3
3
0
1
4
9
02.25
12.25
1
4
4
9
9
0
7.13 COEFICIENTE INTELECTUAL
1
2
3
4
5
6
7
8
9
10
11
12
110
112
118
119
122
125
127
130
132
134
136
138
1
1.6
1.2
2.1
1.8
2.6
2
3.2
2.6
3
3.6
19 100-140 (1-4)
7.14 COEFICIENTE R DE PEARSON
X Y X2 Y2 Xy
María
Olga
Susana
Aldo
Juan
18
15
12
9
3
82
68
60
32
18
324
225
144
81
9
1476
1020
7200
288
54
Ex 157 Ey= 260 Ex= 783 Ey= 16296 Exy= 3558
R= 0.98
REGRESIÓN LINEAL
La relación y la correlación están íntimamente ligadas, ambos implican la
relación entre 2 variables y utilizan el mismo conjunto de los datos básicos.
La relación se encuentra el uso de la relación para determinar una
PREDICCION, cuando la relación es perfecta, esto es cuando todos los puntos
están sobre la recta y se utilizaría para señalar la predicción, la situación se
hace más compleja cuando la relación es imperfecta.
Esta es la recta es la línea de la regresión por los mínimos cuadrados la
distancia vertical en cada punto y la recta representa el error de la producción
parecía el error total de la suma de la producción para que una el error total
seria la suma equilibrada y _ y´
El error total de producción presentado esta dado por ecuación
de regresión lineal para reproducir el lado x
Y´=valor reproducido
By = pendiente
Ay= ordenada al origen
Ecuación por calcular los constantes de regresión
7.15 DEFINICIÓN DE CORRELACIÓN LINEAL
En ocasiones nos puede interesar estudiar si existe o no algún tipo de relación
entre dos variables aleatorias. Así, por ejemplo, podemos preguntarnos si hay
alguna relación entre las notas de la asignatura Estadística I y las de
Matemáticas I. Una primera aproximación al problema consistiría en dibujar en
el plano R2 un punto por cada alumno: la primera coordenada de cada punto
sería su nota en estadística, mientras que la segunda sería su nota en
matemáticas. Así, obtendríamos una nube de puntos la cual podría indicarnos
visualmente la existencia o no de algún tipo de relación (lineal, parabólica,
exponencial, etc.) entre ambas notas.
Otro ejemplo, consistiría en analizar la facturación de una empresa en un
periodo de tiempo dado y de cómo influyen los gastos de promoción y
publicidad en dicha facturación. Si consideramos un periodo de tiempo de 10
años, una posible representación sería situar un punto por cada año de forma
que la primera coordenada de cada punto sería la cantidad en euros invertidos
en publicidad, mientras que la segunda sería la cantidad en euros obtenidos de
su facturación. De esta manera, obtendríamos una nube de puntos que nos
indicaría el tipo de relación existente entre ambas variables.
En particular, nos interesa cuantificar la intensidad de la relación lineal entre
dos variables.
EJEMPLOS
La ecuación por los mínimos cuadrados esta dado por la ecuaciónde regresión
lineal para predecir Y lado X.
Y´=valor reproducido
by = pendiente
ay= ordenada al origen
Ecuación para calcular la constante de regresión
Ejemplo de aprovechamiento
Estudiante
numero
X Promedio de Y
calificaciones
XY X2
1
2
3
4
5
6
7
8
9
10
11
12
110
112
118
119
122
125
127
130
132
134
136
138
1
1.6
1.2
2.1
2.6
1.8
2.6
2
3.2
2.6
3
3.6
110
179.2
141.6
249.9
317.2
225
330.2
260
422.4
384.4
408
496.8
12100
12544
13424
14161
14384
15625
16129
16900
17421
17456
18496
19044
X
4
3
2
1
110 120 130 140
Una psicóloga del desarrollo está interesada si es posible utiliza alturas de los
jóvenes para producir en un posible estatura en la edad adulta y ella reúne las
siguientes datos de la tabla.
a) Trace la grafica
b) Obtener la línea de regresión por mínimo cuadrados
c) En base a estos datos aquí esta estatura podría producir para una
persona de 20 años si a los 3 años de edad tiene una altura de 42
pulgadas.
Individuo Altura la edad de
3 años pulgadas
Altura a la edad
de 20 años y
pulgada
Xy
X2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
30
30
32
33
34
35
36
38
40
41
41
43
45
45
47
48
59
63
62
67
65
61
69
66
68
65
73
68
71
74
71
75
1770
1890
1984
2211
2210
2135
2484
2508
2720
2665
2993
2924
3195
2924
3195
3330
3337
3600
900
900
1024
1059
1156
1225
1296
1444
1600
1681
1681
1849
2025
2025
2209
2304
618 1077 41956 24408
x
5 10 15 20 25 30 35 40 45 50 55 60
50
40
30
20
10
Una neuróloga sospecha que su vela de exótica es una región del cerebro, se
asociación el comportamiento agresivo del individuo con neurotransmisor
cerebral los datos aparecen en una tabla de nutrición los datos promedios de 6
meses.
Menos sujetos Tabla de nivel
exótica(Y)
Numero de
egresos
XY Y2
1
2
3
4
5
6
7
8
9
0.32
0.35
0.38
0.41
0.43
0.51
0.53
0.60
0.63
6
3.8
3
5.1
3
2.8
2.4
3.5
2.2
1.92
1.33
1.140
2.091
1.290
1.938
1.272
2.100
14.467
0.1024
0.1225
0.1444
.1681
0.1849
0.2601
.2809
0.3600
0.3969
x
8
6
4
2
y
a) Hoja de grafica
b) Ecuación de regresión lineal
c) Cuál es el número de actos agresivos que podría producir y éxito
numérico de menos que todo un nivel de exótica 0.46 min gramos
7.16 EL COEFICIENTE DE CORRELACIÓN LINEAL DE PEARSON R
Cuyo valor oscila entre –1 y +1:
0.4 0.7 0.6 0.5 0.3
Correlación tiende a ser lineal directa (mayores valores de X significan mayores
valores de Y), y se aproxima a –1 cuando la correlación tiende a ser lineal
inversa.
Es importante notar que la existencia de correlación entre variables no implica
causalidad.
NOTA: si no hay correlación de ningún tipo entre dos v. a., entonces tampoco
habrá correlación lineal, por lo que r = 0. Sin embargo, el que ocurra r = 0 sólo
nos dice que no hay correlación lineal, pero puede que la haya de otro tipo.
El siguiente diagrama resume el análisis del coeficiente de correlación entre
dos variable
7.17 Definición y características del concepto de Regresión Lineal
En aquellos casos en que el coeficiente de regresión lineal sea “cercano” a +1
o a –1, tiene sentido considerar la ecuación de la recta que “mejor se ajuste” a
la nube de puntos (recta de mínimos cuadrados). Uno de los principales usos
de dicha recta será el de predecir o estimar los valores de Y que obtendríamos
para distintos valores de X. Estos conceptos quedarán representados en lo que
llamamos diagrama de dispersión:
La ecuación de la recta de mínimos cuadrados (en forma punto-pendiente) es
la siguiente
Si queremos estudiar la relación existente entre ambas variables, siguiendo con
el ejemplo anterior referente a la relación entre las ventas de una empresa ( ) t
V y sus gastos en publicidad ( ) t GP, lo que podemos hacer es representar
gráficamente el modelo matemático lineal que podemos considerar para
analizar dicha relación.
EJEMPLO
Estudiante
numero
IQ
X
Promedio de
Y
calificaciones
XY X2
1
2
3
4
5
6
7
8
9
10
11
12
110
112
118
119
122
125
127
130
132
134
136
138
1
1.6
1.2
2.1
2.6
1.8
2.6
2
3.2
2.6
3
3.6
110
179.2
141.6
249.9
317.2
225
330.2
260
422.4
384.4
408
496.8
12100
12544
13424
14161
14384
15625
16129
16900
17421
17456
18496
19044
110 120 130 140
4
3
2
1
O una psicóloga del desarrollo está interesada si es posible utiliza alturas de
los jóvenes para producir en un posible estatura en la edad adulta y ella reúne
las siguientes datos de la tabla.
d) Trace la grafica
e) Obtener la línea de regresión por mínimo cuadrados
f) En base a estos datos aquí esta estatura podría producir para una
persona de 20 años si a los 3 años de edad tiene una altura de 42
pulgadas.
Individuo Altura la edad
de 3 años
pulgadas
Altura a la
edad de 20
años y
pulgada
xy
X2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
30
30
32
33
34
35
36
38
40
41
41
43
45
45
47
48
59
63
62
67
65
61
69
66
68
65
73
68
71
74
71
75
1770
1890
1984
2211
2210
2135
2484
2508
2720
2665
2993
2924
3195
2924
3195
3330
3337
3600
900
900
1024
1059
1156
1225
1296
1444
1600
1681
1681
1849
2025
2025
2209
2304
618 1077 41956 24408
5 10 15 20 25 30 35 40 45 50 55 60
Una neuróloga sospecha que su vela de exótica es una región del cerebro,
se asocia con el comportamiento agresivo del individuo con neurotransmisor
cerebral los datos aparecen en una tabla de nutrición los datos promedios
de 6 meses.
40
30
20
10
50
Menos
sujetos
Tabla de nivel
exótica(Y)
Numero de
egresos
XY Y2
1
2
3
4
5
6
7
8
9
0.32
0.35
0.38
0.41
0.43
0.51
0.53
0.60
0.63
6
3.8
3
5.1
3
2.8
2.4
3.5
2.2
1.92
1.33
1.140
2.091
1.290
1.938
1.272
2.100
14.467
0.1024
0.1225
0.1444
.1681
0.1849
0.2601
.2809
0.3600
0.3969
4.16 32.8 14.467 2.0202
8
6
4
2
0.3 0.4 0.5 0.6 0.7
Y
X
d) Hoja de grafica
e) Ecuación de regresión lineal
f) Cuál es el número de actos agresivos que podría producir y éxito
numérico de menos que todo un nivel de exótica 0.46 min gramos
7.18 ORGANIZADOR GRAFICO DE CORRELACION Y REGRECION LINEAL
CORRELACIÓ
N
Expresa de una manera cuantitativa la magnitud y
dirección de una relación entre 2 variables. Se lo designa
con la letra ry puede variar entre +1 a -1 el signo significa
si la relación es negativa o positiva.
CARACTERÍST
ICAS
Relación perfecta (+ o -)
Relación Imperfecta (+ o -)
Relación Lineal
COEFICIENT
E DE
PEARSON
COEFICIENT
E DE
SPERMAN
CLASIFICACI
ÓN
7.19 EJERCICIOS DE CORRELACION Y REGRECION LINEAL
El número de españoles (en millones) ocupados en la agricultura, para los años
que se indican, era:
Año 1980 1982 1984 1986 1988 1990 1992 1994
Ocupados 2,1 2,04 1,96 1,74 1,69 1,49 1,25 1,16
a) ¿Podría explicarse su evolución mediante una recta de regresión?
b) ¿Qué limitaciones tendrían las estimaciones hechas por esa recta?
[sol] a) Si; b) No vale para hacer estimaciones alejadas de los años
considerados.
2. Asocia las rectas de regresión y = –x +16, y = 2x – 12, y = 0,5x + 5 a las
nubes de puntos siguientes:
3. Asigna los coeficientes de correlación lineal r = 0,4, r = –0,85 y r = 0,7, a las
nubes del problema anterior.
a) Respectivamente: (c), (b), (a). b) Respectivamente: (a), (b), (c)
Tipo II. Cálculo de la correlación y regresión
[a) Calcula la recta de regresión de Y sobre X en la distribución siguiente
realizando todos los cálculos intermedios.
X 10 7 5 3 0
Y 2 4 6 8 10
b) ¿Cuál es el valor que correspondería según dicha recta a X = 7?
a) y = –0,8276x +10,138; b) 4,3448.
5. El número de bacterias por unidad de volumen, presentes en un cultivo
después de un cierto número de horas, viene expresado en la siguiente tabla:
X: Nº de horas 0 1 2 3 4 5
Y: Nº de bacterias 12 19 23 34 56 62
Calcula:
a) Las medias y desviaciones típicas de las variables, número de horas y
número de bacterias.
b) La covarianza de la variable bidimensional.
c) El coeficiente de correlación e interpretación.
d) La recta de regresión de Y sobre X.
6. La tabla siguiente muestra las notas obtenidas por 8 alumnos en un examen,
las horas de estudio dedicadas a su preparación y las horas que vieron la
televisión los días previos al examen.
Nota 5 6 7 3 5 8 4 9
Horas de estudio 7 10 9 4 8 10 5 14
Horas de TV 7 6 2 11 9 3 9 5
a) Representa gráficamente los diagramas correspondientes a nota-estudio y
nota-TV.
b) ¿Se observa correlación entre las variables estudiadas? ¿De qué tipo? ¿En
qué caso estimas que es más fuerte?
b) Sí. Directa; inversa.
7. Con los datos del problema anterior, halla el coeficiente de correlación de
nota-estudio y nota-TV. ¿Qué puede deducirse con más precisión conociendo
la nota que obtuvo una persona en el examen: el tiempo que dedicó al estudio
o el que dedicó a ver la televisión?
0,943382 y (0,846283. El tiempo que dedicó al estudio.
8. Con los mismos datos, halla las rectas de regresión correspondientes y
estima para un alumno que sacó un 2 en el examen:
a) Las horas que estudió.
b) Las horas que vio la TV.
a) Esta = (0,246753 + 1,46753 otra; 2,7 h. b) TV = 14,1299 (1,2987 otra;
11,5 h.
Tipo III. Estimación a partir del a recta de regresión
9. La altura, en cm, de 8 padres y del mayor de sus hijos varones, son:
Padre 170 173 178 167 171 169 184 175
Hijo 172 177 175 170 178 169 180 187
a) Calcula la recta de regresión que permita estimar la altura de los hijos
dependiendo de la del padre; y la del padre conociendo la del hijo.
b) ¿Qué altura cabría esperar para un hijo si su padre mide 174? ¿Y para un
padre, si su hijo mide 190 cm?
a) H = 68,1853 + 0,621859 ; P = 77,4406 + 0,545082 . b) 176,4 cm; 181 cm.
NIVELES DE LOGRO ACTIVIDADES
MEDIADO AUTÓNOMO
TEÓRICO BÁSICO
Lectura comprensiva de correlación y
regresión lineal
Análisis de la Campana de Gauss
Organizador gráfico de regresión lineal
Consulta y lectura comprensiva de los
conceptos de muestreo
TEÓRICO SUPERIOR Análisis de la realización de las gráficas de la
campana de Gauss.
Toma de decisiones para realizar los
ejercicios con la aplicación del muestreo
Análisis de los conceptos investigados
Comprensión de lectura.
TEÓRICO PRÁCTICO ACEPTABLE Aplicación en ejercicios de la teoría
analizada
Formulación de alternativas de solución
Aplicación de los ejercicios propuestos del
muestreo
Realización de ejercicios de la campana
de gauss
TEÓRICO PRÁCTICO AVANZADO Análisis de los problemas que suceden en la sociedad.
Análisis de las variables dependientes e independientes de la sociedad.
Aplicación de ejercicios con datos reales planteados por el docente
Investigación de ejemplos de las variables.
8 CARACTERÍSTICAS DE LAS HIPÓTESIS
Deben basarse en una situación real, es decir deben someterse a
prueba en un universo y contexto bien definido.
8.1 Ejemplo: El contrabando en Ecuador es menor que el contrabando en
Colombia
Dentro de la hipótesis las variables deben ser claras, comprensibles y
concretas, no se debe usar términos confusos.
Ejemplo: Situación económica del Carchi Crisis económica
La relación ente variables de una hipótesis deben ser lógicas.
Las variables de la hipótesis deben ser observables y medibles (esto
significa que deben tener referentes en la realidad); no se deben incluir
aspectos morales porque no podríamos medirlos en la realidad.
Las hipótesis deben estar relacionadas con técnicas disponibles para
probarlas y verificarlas.
Las hipótesis deben referirse a una situación real.
Los términos (variables) de la hipótesis tienen que ser compatibles,
precisos y lo más concretos posibles.
La relación entre variables propuestas por una hipótesis debe ser clara y
verosímil (lógica).
Los términos de la hipótesis y la relación planteada entre ellos, deben
poder ser observados y medidos, o sea tener referentes en la realidad.
Las hipótesis deben estar relacionadas con técnicas disponibles para
probarlas.http://www.antropologiasocial.org/contenidos/tutoriales/tym/Do
cumentos/Hipotesis.pdf
CLASIFICACIÓN DE LAS HIPÓTESIS
HIPÓTESIS DE INVESTIGACION
a. Hipótesis Descriptiva
b. Hipótesis de Correlación
c. Hipótesis de Diferencial de Grupos
d. Hipótesis de Relaciones de Casualidad
e. Hipótesis Casuales Bivariables
f. Hipótesis Casuales Multivariables
8.2 HIPOTESIS NULA
8.3 HIPOTESIS ALTERNATIVA
8.4 HIPOTESIS ESTADISTICA
a. Hipótesis estadísticas de Estimación
b. Hipótesis estadísticas de Correlación
c. Hipótesis estadísticas de Diferencial de medios o otras Variables
8.5 EJEMPLO DE HIPÓTESIS:
A mayor cantidad de vehículos en una ciudad; mayor congestión
vehicular.
A mayor variedad en el trabajo; habrá mayor motivación individual
hacia él.
A mayor demanda de un producto; mayor producción del mismo.
1. HIPÓTESIS DE INVESTIGACIÓN (Hi):
Son propuestas de experimentos acerca de las posibles relaciones entre dos
o más variables.1http://iealidia.blogdiario.com/tags/hipotesis/
Se las simboliza como Hi; H1, H2, H3 (cuando son varias)
Las hipótesis de investigación a su vez pueden ser:
Hipótesis descriptivas de un valor o dato pronosticado.
Hipótesis correlaciónales.
Hipótesis de diferencia de grupos.
Hipótesis causales.
8.6 HIPÓTESIS DE UN VALOR O DATO PRONÓSTICADO:
Esta hipótesis trata de predecir un dato o valor en una o más variables que se
van a medir u observar. No es sencillo realizar estimaciones con precisión con
respecto a ciertos fenómenos.
8.7 HIPÓTESIS CORRELACIONADAS:
Especifican las relaciones entre dos o más variables y corresponden a los
estudios correlaciónales.
Ejemplos:
“Los altos impuestos a pagar en la CAE están relacionados con el
Contrabando en Tulcán”
Las hipótesis correlacionadas no solo pueden establecer que dos o
más variables se encuentren vinculadas, sino también como están
asociadas.
Ejemplos:
A mayor inflación de Precios, habrá menor consumo. (Aquí la hipótesis
indica que cuando una variable aumenta, la otra disminuye, o
viceversa).
8.8 HIPÓTESIS DE DIFERENCIA ENTRE GRUPOS:
Su finalidad es comparar grupos:
Por Ejemplo;
Los niños tiene más cariño por sus padres que por sus tíos.
Viajar vía aérea de Tulcán a Quito implica menos tiempo que viajar vía
terrestre de Tulcán a Quito.
8.9 HIPÓTESIS CAUSALES:
Este tipo de hipótesis no solamente afirma la o las relaciones entre dos o más
variables y la manera en que se manifiesta, sino que además propone un
“sentido de entendimiento” de las relaciones. Tal sentido puede ser más o
menos completo, esto depende del número de variables que se incluya, pero
todas estas hipótesis establecen relaciones de causa -efecto.
Las hipótesis causales pueden simbolizarse como.
HIPÓTESIS NULA (Ho):
La hipótesis nula es en cierto modo, el reverso de las hipótesis de
investigación. También constituyen proposiciones acerca de la relación entre
variables, solo que sirven para negar lo que afirma la hipótesis de
investigación. 1 http://personal.us.es/vmanzano/docencia/analisis/guias/FichaP
SHN.pdf
La hipótesis nula se simboliza Ho.
Ejemplo:
Hi: la inseguridad crece en el Ecuador por falta de trabajo
Ho: la inseguridad no crece en el Ecuador por falta de trabajo
Hi: El contrabando disminuirá en un 20% en el mes de diciembre porque
se ha intensificado el control en la frontera.
Ho: El contrabando no disminuirá en un 20% en el mes de diciembre;
porque falta control en la frontera y por el aumento de los pasos ilegales.
HIPÓTESIS ALTERNATIVA (Ha):
Son posibilidades alternas ante las hipótesis de investigación y nula; ya que
nos presentan otra descripción explicación distintas a las que proporcionan
estos tipos de hipótesis.
Al responder a un problema es necesario hallar diferentes hipótesis como
respuesta y elegir entre ellas.
La hipótesis alternativa se simboliza Ha y solo puede formularse cuando hay
otras posibilidades.1http://www.mitecnologico.com/Main/HisConceptos.
Ejemplos:
Hi: La empresa Nestlé es grande gracias a su producción y su buen
producto.
Ho: La empresa Nestlé no es grande
Ha: La empresa Nestlé es pequeña, mediana
HIPÓTESIS ESTADÍSTICA:
Representa la transformación de las hipótesis de investigación, nulas y
alternativas en símbolos estadísticos. Se pueden formular solo cuando los
datos del estudio son cuantitativos (números, porcentajes,
promedios).1http://www.monografias.com/trabajos17/pruebas-de-hipot.shtml
Hay tres tipos de hipótesis estadísticas:
1. De estimación.
2. De correlación.
3. De diferencia de medias.
8.10 HIPÓTESIS ESTADÍSTICAS DE ESTIMACIÓN:
Sirve para evaluar la suposición de un investigador respecto del valor de
alguna característica en una muestra de individuos, otros seres vivos,
sucesos u objetos y en una población.
8.11 HIPÓTESIS ESTADÍSTICAS DE CORRELACIÓN:
Tiene por objetivo traducir en términos estadísticos una correlación entre dos
o más variables. El símbolo de una correlación entre dos variables es “r”, y
entre dos o más variables “R”.
8.12 HIPÓTESIS ESTADISTICAS DE LA DIFERENCIA DE MEDIAS U
OTROS VALORES:
En estas hipótesis se compara una estadística entre dos o más grupos.
8.13 EJEMPLOS DE HIPOTESIS:
8.14 Hipótesis descriptiva
1. Es día martes se realizaron 40 trámites de exportación a Colombia.
2. El mes de diciembre las importaciones subirán en un 30 %.
3. En el 2011 las exportaciones aumentara en un 10 %.
4. En el 2011 el contrabando bajara en un 2 %.
5. En diciembre la producción del banano aumentara porque existe
mayor demanda.
Hipótesis nula
1. Los bajos aranceles en las exportaciones de camarón provoca
mayores exportaciones a Canadá
Los altos aranceles en las exportaciones de camarón provoca menores
exportaciones a Canadá
2. Las exportaciones de petróleo aumentaran en 2011, por la mayor
producción en la refinería Sacha.
Las exportaciones de petróleo disminuirán en 2011, por la menor
producción en la refinería Sacha.
3. El tipo de aforo de mercancías agilita el pronto despacho, saliendo las
mercancías de las zonas primarias en menor tiempo
El tipo de aforo de mercancías entorpece el pronto despacho, saliendo
las mercancías de las zonas primarias en mayor tiempo
Hipótesis Alternativa
1.- El tratado de Libre Comercio firmado por Ecuador mejora las
exportaciones con Colombia, Venezuela, Perú.
2.- Los ingresos percibidos del Petróleo en Ecuador se invierten en salud,
educación, vivienda.
PRUEBA DE HIPÓTESIS
Se la llama ensayo de hipótesis. Son procedimientos que se unen para
determinar si es razonable o correcto la formulación en Ho, como resultado
aceptamos o rechazamos Ho.
8.15 PASOS PARA LA PRUEBA DE HIPOTESIS
1) Formular la hipótesis nula (Ho) y la hipótesis alternativa (H1).
2) Determinar si la prueba es unilateral y bilateral.
3) Asumir el nivel de significación = 5%, = 1%, =10%
4) Determinar la distribución muestral que utiliza la prueba.
N= 50 > 30 se puede utilizar la prueba de hipótesis.
5) Elaborar un esquema de prueba.
6) Calculo estadístico :
7) TOMA DE DESICIONES:
Aceptación o rechazo del Ho.
Ṕ = proporción de la muestra %
P= proporción de la población=
EJEMPLO 1:
Para evaluar el nivel mental de los ingresantes de la Universidad se
estandarizo la habilidad mental encontrándose un C.I. (coeficiente intelectual)
promedio de 101,2 con una desviación estándar de 13,8. Aplicada de la
prueba a una muestra de 60 ingresantes de esta universidad se calculó que el
C.I. promedio es de 106,4 con una desviación estándar de 16,4. ¿El nivel
mental de los ingresantes es superior al término medio?
Variable de estudio: La habilidad mental de los X estudiantes.
µ = rendimiento mental promedio de los ingresantes.
X = rendimiento promedio de la muestra.
Solución:
1) Ho: µ= 101,2
Ha: µ > 101,2
2) Prueba unilateral de acuerdo a Ha.
3) Realizar la prueba de los niveles de significación de 5% y 1%.
4) Se admite que la variable aleatoria de la prueba es la media de los
coeficientes de inteligencia Xi.
5) Como n > 30 podemos usar una distribución normal de probabilidades
para calcular los valores críticos y elaborar el esquema grafico de la
prueba 99%.
6) Calculo estadístico de la prueba.
7) Toma de decisiones:
A los niveles de significancia de 0,05 ^ 0,01 observamos que el estadístico Z=
2,92 se ubica en la zona de rechazo, esta significancia que la prueba es muy
significativa luego rechazamos la Ho: µ= 101,2 y no rechazamos que el nivel
mental de los ingresantes es superior al término medio.
EJEMPLO 2:
Un político supone que menos del 60% de los votos de su territorio le son
favorables. Con el fin de verificar su conjetura. Selecciona una muestra
representativa compuesta por 200 votantes y aplica una encuesta, obteniendo
100 respuestas a su favor. Probar que los resultados confirman la creencia
del político, es decir, que los votos favorables de su territorio son menores del
60%.
8.16 PRUEBA DE DIFERENCIAS DE MEDIAS
Cuando existen dos grupos de investigación en una `población.
Matemáticamente se puede expresar de la siguiente manera
POBLACIÓN
Cuando n₁, n₂> 30
MUESTRA
EJEMPLO 3
Un grupo de investigadores ha diseñado un cuestionario sobre la tensión,
consistente en 15 sucesos. Ellos están interesados en determinar si existe
una coincidencia entre dos culturas acerca de la cantidad relativa de ajustes
que acarrea cada suceso. El cuestionario se aplica a 300 estadounidenses y
300 italianos. Cada individuo debe utilizar el evento “matrimonio” como
estándar y juzgar los demás eventos en relación con el ajuste necesario para
el matrimonio. El matrimonio recibe un valor arbitrario de 50 puntos. Si se
considera que un evento requiere de más ajustes que el matrimonio, el evento
debe recibir más de 50 puntos. El número de puntos excedentes depende de
la cantidad de ajustes requeridos. Después de que cada sujeto de cada
cultura ha asignado puntos a todos los eventos, se promedian los puntos de
cada evento. Los resultados aparecen en la siguiente tabla:
EVENTOS ESTADOUNIDENSES ITALIANOS
Muerte de la esposa
Divorcio
Separación de la pareja
Temporada en prisión
Lesiones personales
Matrimonio
Despedido del trabajo
Jubilación
Embarazo
Dificultades sexuales
Reajustes económicos
Problemas con la
familia política
Problemas con el jefe
Vacaciones
Navidad
100
73
65
63
53
50
47
45
40
39
39
29
23
13
12
80
95
85
52
72
50
40
30
28
42
36
41
35
16
10
a. Suponga que los datos tienen al menos una escala de intervalo
y calcule la correlación entre los datos estadounidenses y la de
los italianos.
b. Suponga que los datos sólo tienen una escala ordinal y calcule
la correlación entre los datos de ambas culturas.
0
20
40
60
80
100
0 50 100 150
Series1
0,8519
La r es alta y positiva es decir que los comportamiento de las dos
nacionalidades son bastante similares
EJEMPLO 4
Una muestra de 80 alambres de acero producidos por la fábrica A de una
resistencia media de rotura de 1230 lbs. y S= 120 lbs.; otra muestra de 100 de
alambres de aceros producidos por la fábrica B de una resistencia media de
1190 lbs. Con una S = 90 lbs. ¿Hay una diferencia real en resistencia media
de las dos marcas de alambre de acero si ?
Solución:
1) H₀=U₁=U₂
Hₐ = U₁<U₂; U₁>U₂
2) Es una campana bilateral
3) El nivel de significación es
4) Se utiliza una diferencias de medias n₁=80>30; n₂ 100>30
5) Gráfico
6) Calculo estadístico
7) Toma de decisiones
El esquema estadístico cae en la zona de rechazo por lo tanto rechazamos
la hipótesis nula y se puede deducir que existe una diferencia real de la
resistencia media de las dos marca de acero de cada una de las fábricas.
EJEMPLO 5
Un aditivo servirá más millas por galón. La compañía ha reutilizado un gran
número de mediciones recorridas en la gasolina sin aditivo, bajo condiciones
controladas rigurosamente, los resultados muestra una media de 2,47 millas
por galón y un S= 4,8. Se realizan pruebas con una muestra de 75 autos que
utilizan la gasolina con aditivos, la media de la muestra es de 26,5 millas/
galón
Solución:
1) H₀= 26,5
U 24,7
Hₐ : El nuevo aditivo incrementas el número de millas por galón por lo
tanto X=26,5 en donde U>24,7
2) La prueba es unilateral a la derecha
3) El nivel de significación
4) N>30 por lo tanto se utiliza la prueba de hipótesis
5) Grafico
6) Calculo estadístico
7) Toma de decisiones
Rechazamos la hipótesis nula y aceptamos la hipótesis alternativa
NIVELES DE
LOGRO
ACTIVIDADES
MEDIADO AUTÓNOMO
TEÓRICO
BÁSICO
Lectura comprensiva de la prueba de hipótesis,
Análisis de la prueba de hipótesis,
Análisis y comprensión de la prueba de hipótesis atravesó de
las tic’s
Consulta y lectura comprensiva de la prueba de hipótesis
TEÓRICO
SUPERIOR
Análisis de la realización de ejercicios de la prueba de
hipótesis.
Toma de decisiones para realizar los ejercicios con la
aplicación de la prueba de hipótesis mediante la
aplicación de los 7 pasos
Análisis de los conceptos investigados sobre la prueba de
hipótesis.
Comparación de los diferentes conceptos investigados sobre la
prueba de hipótesis,
TEÓRICO
PRÁCTICO
ACEPTABLE
Aplicación en ejercicios de la teoría analizada acerca
de la prueba de hipótesis,
Formulación de alternativas de solución
Aplicación de los ejercicios propuestos de la prueba de
hipótesis,
Realización de ejercicios de la prueba de hipótesis,
TEÓRICO
PRÁCTICO
AVANZADO
Análisis de los problemas que suceden en la sociedad.
Análisis de ejercicios propuestos por diversos autores
Aplicación de ejercicios con datos a través de la elaboración de
un proyecto
Investigación de ejemplos de Hipótesis
“T“DE STUDENT
En probabilidad y estadística, la distribución t (de Student) es una
distribución de probabilidad que surge del problema de estimar la media de una
población normalmente distribuida cuando el tamaño de la muestra es
pequeño.
Aparece de manera natural al realizar la prueba t de Student para la
determinación de las diferencias entre dos medias muéstrales y para la
construcción del intervalo de confianza para la diferencia entre las medias de
dos poblaciones cuando se desconoce la desviación típica de una población y
ésta debe ser estimada a partir de los datos de una muestra
8.17 CARACTERÍSTICAS
El tamaño de la muestra es menor a 30
La población de donde se obtiene los datos está distribuida
normalmente
Se desconoce la desviación estándar de la población, entonces
haremos uso de la distribución de student
8.18 Grado de libertad:
(n-1) cuando se ha estimado un parámetro
Cuando se estiman dos parámetros (gl= n₁+n₂-2)
gl =n-k hay que mirar en la tabla de T de student con el coeficiente de
estimación de ;
Solución u= rendimiento mental medio en la estandarización.
u = 101
= Rendimiento mental medio de la muestra
= 105,4
8.19 FORMULACION DE HIPOTESIS
Ho: u = 101 No existe diferencias significativas en el rendimiento
mental de la muestra y de la población.
H1: u ˃ 101
1) Prueba unilateral de cola derecha de acuerdo con H1
2) Nivel de significación asumido: α = 0,01 = 1%
3) Se debe utilizar una distribución muestral de medias n < 30 (muestra
pequeña) se distancia Q ( desviación estándar de la población )
4) α=0,01
Los grados de libertad son:
n - 1 = 15-1 = 14
14; α=0,01 prueba 1 cola 2,624
5) Calculo estadístico
= 105,4 ; u = 101 ; S = 5,3 ; n = 15
t =
t = 3,11
6) Toma de decisiones :
Si t = 3,11 se halla en la zona de rechazo por lo tanto se descarta que u = 101
y se acepta la alternativa u es decir el grupo de los 15 alumnos tiene
rendimiento mental mayor que el promedio de estandarización.
EJERCICIO:
En un laboratorio farmacéutico se produce comprimidos de un cierto
medicamento, con un peso promedio de 2 gr. promedio por cada comprimido,
para determinar si la maquina sigue en iguales condiciones de producir se toma
una muestra de 10 tabletas: 2,04 ; 1,96 ; 2,00 ; 1,98 ; 2,02 ; 2,01 ; 1,97 ; 1,94 ;
2,03 ; 2,01 ; asimilando α=0,01 ; verificar si la maquina está en buenas
condiciones.
Solución: U2= promedio de tabletas producidas por la máquina.
1) Formulación de Hipótesis:
Ho: U = 2 La máquina se halla en buenas condiciones.
H1: U ≠ 2 La máquina no se halla en buenas condiciones.
2) Prueba bilateral:
H1: Hay dos probabilidades
U ˃ 2 y U < 2
3) α = 0,01
4) U=2g siendo una muestra pequeña n=10
No aplica a la distribución normal y se aplica la t de student.
5) α = 0,01 Prueba bilateral
gl = n-1 = 10-1 = 9 gl t = 3,25
6) Cálculo estadístico
t =
t = -0,39
7) Toma de decisiones:
Si t = - 0,39 entonces u se encontraría en la zona de aceptación es decir se
acepta la Ho es decir la maquina se encuentra en buenas condiciones.
Zona de Aceptación Zona de Rechazo
NIVELES DE
LOGRO
ACTIVIDADES
MEDIADO AUTÓNOMO
TEÓRICO
BÁSICO
Lectura comprensiva de la T-de student,
Análisis de la T-de student,,
Análisis y comprensión de la T-de student,atraves de las tics
Consulta y lectura comprensiva de la T-de student,
TEÓRICO
SUPERIOR
Análisis de la realización de ejercicios de la T-de
student
Toma de decisiones para realizar los ejercicios
con la aplicación de la
Análisis de los conceptos investigados sobre la T-de student,
Comparación de los diferentes conceptos investigados sobre
la T-de student,
TEÓRICO
PRÁCTICO
ACEPTABLE
Aplicación en ejercicios de la teoría analizada
acerca de la T-de student,
Formulación de alternativas de solución a través
de la T-de student,
Aplicación de los ejercicios propuestos de la T-de student,
Realización de ejercicios de la T-de student,
TEÓRICO
PRÁCTICO
AVANZADO
Análisis de los problemas que suceden en la
sociedad.
Análisis de ejercicios propuestos por diversos
autores
Aplicación de ejercicios con datos a través de la elaboración
de un proyecto
Investigación de ejemplos sobre la T-de student,
PRUEBA DE Ji- CUADRADO O
Distribución Ji-cuadrado, también denominada Ji-cuadrado de Pearson, es una
distribución de probabilidad continua con un parámetro k que representa los
grados de libertad de la variable aleatoria. Se suele usar la denominada prueba
Ji-cuadrado como test de independencia y como test de bondad de ajuste.
En realidad la distribución Ji-cuadrado es una distribución muestral, es decir
que si se extraen todas las muestras posibles de una población normal y a
cada muestra se le calcula su varianza, se obtendrá la distribución muestral de
varianzas. Para estimar la varianza poblacional o la desviación estándar, se
necesita conocer el estadístico X². Si se elige una muestra de tamaño (n) de
una población normal con varianza, el estadístico:
Donde n es el tamaño de la muestra, S² la varianza muestral y la varianza de la
población de donde se extrajo la muestra.
8.20 Propiedades de las distribuciones Ji-cuadrado
1. Los valores de X2 son mayores o iguales que 0.
2. La forma de una distribución X2 depende del gl=n-1. En consecuencia, hay
un número infinito de distribuciones X2.
3. El área bajo una curva ji-cuadrada y sobre el eje horizontal es 1.
4. Las distribuciones X2 no son simétricas. Tienen colas estrechas que se
extienden a la derecha; esto es, están sesgadas a la derecha.
5. Cuando n>2, la media de una distribución X2 es n-1 y la varianza es 2(n-1).
6. El valor modal de una distribución X2 se da en el valor (n-3).
Chi 2
Otro de los modelos estadísticos para comprobar si las hipótesis de un
problema son verdaderas o falsas se sigue los siguientes pasos
1) la CHI 2 es utilizada para variables cuantitativas y cualitativas Ej. Cualidades
sí o no, verdadero falso y las cuantitativas son a través de números que se los
obtiene en una población, que se deben sacar diferentes muestras por
extractos que generalmente se los determina a través de las columnas o
intervalos o también se los obtienen a través de las tablas de valores.
2) su símbolo de chi 2 es X2 se la representa en el plano cartesiano
Únicamente el CHI² solo es de una sola cola a la derecha.
Hay dos formas diferentes para determinar los grados de libertad.
gl = K – 1 o gl = ( c - ) ( F – 1 ) para la tabla de valores
C columnas y F filas
Sus fórmulas matemáticas de chi 2
X2 =
X 2 =
Oi frecuencias observadas
Ei frecuencias operadas
Las frecuencias operadas se las obtienen multiplicando de un número total por
el porcentaje o también se las obtiene de la división.
E = (multiplicaciones)
Para llegar a la toma de decisiones también se debe utilizar los siete pasos que
se dan tanto en la prueba de hipótesis como en la t de student.
Generalmente su símbolo es .
Es una prueba que puede usarse para cualquier nivel de datos, es una medida
donde se encuentran las frecuencias (observadas y esperadas), en el caso de
las frecuencias esperadas estas se las obtiene a través de otros resultados.
Matemáticamente se la puede expresar de la siguiente forma:
= dónde:
fe= frecuencia esperada
X2 = Siempre va hacer positiva por estar elevada al cuadrado
Como en las anteriores pruebas hay que dar los 7 pasos fundamentales hasta
llegar a la toma de decisiones.
Generalmente se presentan dos casos para encontrar los grados de libertad.
1)
2) esta cuando existen filas y columnas y se realizan
tablas de contingencia.
Representación gráfica de la Campana de Gauss la cual solo tiene cola dirigida
hacia la derecha por poseer valores positivos.
a) X = 0,05 >>>>
(4gl) = 9,488 Se lee en la tabla.
b) X =0,05 >>>>
= 18,307
EJEMPLO:
Un jugador quiere probar que es legal el dado con el que juega. Tiro el dado
120 veces y obtuvo la siguiente distribución de frecuencias de las caras
resultantes.
a) Enuncie las hipótesis de la prueba y determine las frecuencias
esperadas.
b) Describa la estadística de la prueba
c) Determine la región crítica de la prueba al nivel de significación del 5%.
d) ¿A qué conclusión llega usando el nivel de significación 0,05?
e) Determine la probabilidad P.
1.- Ho: El dado es legal.
Ha: El dado no es legal.
2.- Es de dos colas.
3.- Nivel de confianza
4.-
gl= k-1 gl=6-1 gl=5
5.-
RESULTADO 1 2 3 4 5 6
FRECUENCIA 15 25 33 17 16 14
11,07
Zona
aceptación
6.-
Ei 20 20 20 20 20 20
Oi 15 25 33 17 16 14
6. Toma de decisiones Se acepta la hipótesis alternativa y se rechaza la
hipótesis nula, es decir el dado del jugador no es legal ya que se
encuentra dentro de la zona de rechazo
EJEMPLO:
1. Ho.- El suero no tiene efecto, y la recuperación es independiente del
uso del suero.
Ha.- que el suero es el que permite la recuperación del paciente.
2. Es cola unilateral
3. 0,05 (N. significancia.)
Nivel de confianza 95%
4. n =200 personas se puede utilizar la ji cuadrado para cualquier valor de
datos-
5. GRÁFICO
gl =(F-1 ) (C-1)
gl =(2-1) (2-1)
x²=3,84
6. Calculo de x²
X2= (75 - 70)2 / 70 + (65 - 70)2 / 70 + (25-30)2 /30 + (35-30) 2 / 30 =
2,38
8.21 FRECUENCIAS OBSERVADAS
CURADOS NO CURADOS TOTAL
GRUPO A USANDO
SUERO
75 25 100
GRUPO B SIN SUERO
65 35 100
TOTAL
140 60 200
8.22 FRECUENCIAS ESPERADAS (DE Ho)
CURADOS NO CURADOS TOTAL
GRUPO A USANDO
SUERO
70 30 100
GRUPO B SIN SUERO
70 30 100
TOTAL
140 60 200
7. Ho aceptamos, concluyendo que el suero no tiene efecto, que la
recuperación es independiente
Fe =(80 – 40) / 200 = 16
Fe= FRECUENCIA ESPERADA = (total del renglón) (total columna) / gran
total
Fe =(100 – 140) / 200 = 7
Fe =(100 – 60) / 200 = 30
EJERCICIO
La falta de muestra de estudiantes aprobados y suspendidos por 3 profesores
X, Y, Z
Ho= La proporción de estudiantes suspendidos son iguales.
Ha = L proporción de estudiantes suspendidos no son iguales.
X2 = (50 – 46,25)2 / 46,75 + (47 – 51,85)2 / 51,85 + (56 – 54,40)2 /54,40 + (5 –
8,25) 2 / 8,25 + (14 -9,15) 2 /9,15 + (8 -9,60)2 / 9,60
X2 = 4, 84
gl = (F-1) (C – 1)
gl = (2-1) (3-1)
X2 = 4, 61
X2= 0, 95 = 5, 99
X Y Z TOTAL
APROBADOS 50 47 56 153
SUSPENDIDOS
5 14 8 27
TOTAL
55 61 64 180
X Y Z TOTAL
APROBADOS 46,75 51,85 54,40 153
SUSPENDIDOS
8,25 9,15 9,6 27
TOTAL 55 61 64 180
NIVELES DE
LOGRO
ACTIVIDADES
MEDIADO AUTÓNOMO
TEÓRICO
BÁSICO
Lectura comprensiva de la CHI Cuadrado ,
Análisis de la CHI Cuadrado
Análisis y comprensión de la CHI Cuadrado de las tic’s
Consulta y lectura comprensiva de la CHI Cuadrado
TEÓRICO
SUPERIOR
Análisis de la realización de ejercicios de la JI Cuadrado.
Toma de decisiones para realizar los ejercicios con la
aplicación de la CHI Cuadrado mediante la aplicación de
los 7 pasos
Análisis de los conceptos investigados sobre la CHI Cuadrado
Comparación de los diferentes conceptos investigados sobre la CHI
Cuadrado
TEÓRICO
PRÁCTICO
ACEPTABLE
Aplicación en ejercicios de la teoría analizada acerca de la
CHI Cuadrado
Formulación de alternativas de solución
Aplicación de los ejercicios propuestos de la CHI Cuadrado
Realización de ejercicios de la CHI Cuadrado ,
TEÓRICO
PRÁCTICO
AVANZADO
Análisis de los problemas que suceden en la sociedad.
Análisis de ejercicios propuestos por diversos autores
Aplicación de ejercicios con datos a través de la elaboración de un
proyecto
Investigación de ejemplos sobre la JI Cuadrado
CONCLUSIÓNES
De acuerdo con la realización del presente trabajo, hemos llegado a las
siguientes conclusiones:
La Estadística Descriptiva es un instrumento muy empleado por parte de
los investigadores en las distintas áreas científicas y su necesidad e
importancia han ido aumentando durante los últimos años.
El interés de los diferentes usuarios por la información Estadística
obedece principalmente a que permite adentrarse en aspectos
importantes de los fenómenos económicos y sociales: Su magnitud, es
decir, las dimensiones que estos tienen y su estructura, o sea, la forma
como esos fenómenos se desagregan en sus componentes.
Para que las Estadísticas sean de utilidad en cuanto a la caracterización
de los fenómenos y al conocimiento de la realidad, deben cumplir
determinados requisitos, siendo el principal el de veracidad, en el
sentido de que los datos correspondan a cuantificaciones con suficiente
precisión, de los universos de estudio y sus diversos subconjuntos,
dentro de márgenes de tolerancia. A asimismo los datos deben ser
conceptualmente significativos, es decir, obtenidos a partir de
definiciones previamente establecidas.
RECOMENDACIONES
Es necesario el uso de la Estadística en la empresa, ya que a través de
ésta se cuenta con la capacidad para reconocer que actividades o
productos le generan utilidad, y cuales solo pérdida. No contar con datos
e interpretarlos correctamente, es para los administradores como
caminar a oscuras. Contar con los datos, les permite ver lo que está
aconteciendo y en consecuencia tomar las medidas más apropiadas.
Toda empresa debe contar con datos estadísticos en cuanto a lo que
acontece tanto interna como externamente, para decidir sobre bases
racionales, y adoptar las medidas preventivas y correctivas con
suficiente tiempo para evitar daños, en muchos casos irreparables para
la organización.
También es necesario acompañar la Estadística de las poderosas
herramientas informáticas, porque le permiten a los directivos, asesores
y personal, contar con la suficiente información para mejorar a partir de
ella los procesos de la empresa como por ejemplo: Tomar mejores
decisiones comerciales, mejorar la seguridad y hacer un uso mucho más
productivo y provechoso de los recursos.
10. FINANCIEROS Y TÉCNICOS.
DESCRIPCIÓN CANTIDAD VALOR UNITARIO VALOR TOTAL
Papel bond 200 0,04 8
Impresiones 200 0,04 8
Material de oficina 0,00
Movilización 3
Internet 3
Imprevistos 5
TOTAL 200 0,08 21
8. CRONOGRAMA DE TAREAS
T DESCRIPCION DE LA TAREA 1 2 3 4 5 6 7 8
T1 X
T2 X
T3 X
T4 X
T5 X
T6 X
T7 X
T8 X
T9 X
T10 MODULO ESTADISTICA INFERENCIAL X
9 ANEXOS
9.1 ORGANIZADOR GRAFICO DE LA ESTADISTICA DESCRIPTIVA E
INFERENCIAL
Universidad Politécnica Estatal del Carchi
Comercio Internacional, Integración,
Administración y Economía Empresarial
Proyecto propuesto
por el estudiante
Universidad Politécnica Estatal del Carchi
Comercio Internacional, Integración, Administración y Economía
Empresarial.
Escuela: Comercio Exterior y Negociación Comercial Internacional
TEMA: proyecto de aplicación de correlación, regresión lineal
SIMPLE APLICANDO Prueba de Hipótesis, T-STUDEN Y CHI2.
Integrantes:
Coral Sánchez Nancy
Ramírez Carla Damaris
Rosero Carmen Tatiana
Vizcaíno Luis Javier
Nivel: sexto Paralelo: “a” Noche
AÑO-LECTIVO
2012
1.1 INTRODUCCIÓN
Los profesionales de la educación, como parte de su que hacer profesional,
realizan investigación científica: evaluación de la calidad de la educación,
someten a prueba diferentes métodos de comprensión lectora, estudian
problemas del aprendizaje, entre otros. Es así, que contamos con Internet,
como fuente general de información, que permite disponer de información
educativa, por ejemplo, sobre evaluaciones muéstrales, que realiza el
Ministerio de Educación y que está disponible en la página web:
Una vez que conoce tanto la forma de recoger información como la forma de
presentar a la misma, sea en forma de tablas o con el tratamiento realizado
para elaborar una tabla de frecuencias, ahora es conveniente seguir con las
características que permiten describir a un conjunto de datos que se recogen
de un problema a investigarse.
1.4 DEFINICIÓN DE ESTADÍSTICA INFERENCIAL
Estudia el comportamiento y propiedades de las muestras, y la posibilidad y
límites de la generalización de los resultados obtenidos a partir de aquellas a
las poblaciones que representan. Esta generalización de tipo inductivo, se basa
en la probabilidad. También se le llama también estadística matemática, por su
complejidad matemática en relación a la estadística descriptiva. (muestra. http://
www.wikipedia.)
Tiene como objetivo generalizar las propiedades de la población bajo estudio,
basado en los resultados de una muestra representativa de la población.
Es una parte de la Estadística que comprende los métodos y procedimientos
estadísticos en los que interviene la aplicación de modelos de probabilidad y
mediante los cuales se realiza alguna afirmación sobre poblaciones con base
en la información producida por muestras para deducir propiedades (hacer
inferencias) de una población, a partir de una pequeña parte de la misma
(muestra). (http://www.wikipedia: estadísticas.)
Tema: Proyecto de aplicación al comercio exterior aplicando correlación,
regresión lineal simple aplicando, prueba de hipótesis, t-student y chi2 con
ayuda del programa SPSS.
1.2 Problema
El desconocimiento de la correlación, prueba de hipótesis, T-Student y Chi 2 y
su aplicación en problemas del contexto.
1.3 Objetivos
Objetivo General
Solucionar los datos investigados de exportaciones e importaciones de
comercio exterior aplicando correlación, regresión lineal, prueba de
hipótesis, T-Student y Chi 2.
Objetivos Específicos
Identificar la correlación de datos de exportaciones
Determinar su regresión lineal.
Identificar la hipótesis nula y la hipótesis alternativa.
Determinar si la prueba es unilateral o bilateral.
Asumir el nivel de significación de la prueba.
Determinar la distribución muestral que se usará en la prueba.
Calcular el estadístico de la prueba.
Tomar la decisión, para esto, se comparan el esquema de la parte de
esquema de prueba.
Determinar ejercicios en relaciona a nuestra carrera de comercio
exterior.
Justificación
El uso de un programa informático (SSPS), es muy importante para la
resolución de problemas relacionados al comercio exterior por que representa
un alto nivel de importancia para una buena toma de decisiones.
En la estadística la aplicación de sistemas informáticos se da con mayor
frecuencia remplazando los procesos manuales, permitiendo al usuario
ahorrar tiempo y obtener resultados de manera directa y segura, haciendo que
de esta manera se vuelva más competitivo y profesional; permitiendo a la vez
ampliar su panorama ocupacional y logrando así la correcta toma de decisiones
en el campo laboral.
1.5 MARCO TEÓRICO
El SPSS
SPSS es un programa estadístico informático muy usado en las ciencias
sociales y las empresas de investigación de mercado. Originalmente SPSS fue
creado como el acrónimo de Statistical Package for the Social Sciences aunque
también se ha referido como "Statistical Product and Service Solutions" (Pardo,
A., & Ruiz, M.A., 2002, p. 3). Sin embargo, en la actualidad la parte SPSS del
nombre completo del software (IBM SPSS) no es acrónimo de nada.
Como programa estadístico es muy popular su uso debido a la capacidad de
trabajar con bases de datos de gran tamaño. En la versión 12 es de 2 millones
de registros y 250.000 variables. Además, de permitir la recodificación de las
variables y registros según las necesidades del usuario. El programa consiste
en un módulo base y módulos anexos que se han ido actualizando
constantemente con nuevos procedimientos estadísticos. Cada uno de estos
módulos se compra por separado.
Actualmente, compite no sólo con softwares licenciados como lo son SAS,
MATLAB, Statistica, Stata, sino también con software de código abierto y libre,
de los cuales el más destacado es el Lenguaje R. Recientemente ha sido
desarrollado un paquete libre llamado PSPP, con una interfaz llamada PSPPire
que ha sido compilada para diversos sistemas operativos como Linux, además
de versiones para Windows y OS X. Este último paquete pretende ser un clon
de código abierto que emule todas las posibilidades del SPSS.
CORRELACIÓN LINEAL
El análisis de correlación se dirige sobre todo a medir la fuerza de una relación
entre variables. El coeficiente de correlación lineal, r, es la medida de la fuerza
de la relación lineal entre dos variables. La fortaleza de la relación se determina
mediante la magnitud del efecto que cualquier cambio en una variable ejerce
sobre la otra. (JOHNSON, 1990)
Si X o Y son las dos variables en cuestión, un diagrama de la dispersión
muestra la localización de los puntos (X,Y) sobre un sistema rectangular de
coordenadas. Si todos los puntos del diagrama de dispersión parecen estar en
una recta, como la figura 14(a) y 14(b) la correlación se llama lineal. (SPIEGEL,
1992)
Y Y Y
X X
(a) Correlación lineal positiva (b) Correlación lineal negativa (c) Sin
correlación
Si Y tiende a crecer cuando X crece, como la figura anterior, la correlación se
dice positiva o directa. Si Y tiende a decrecer cuando X crece, como la figura
14.1 (b), la correlación se dice negativa o inversa.
Si todos los puntos parecen estar sobre una cierta curva la correlación se llama
no lineal, y una ecuación no lineal será apropiada para la regresión. Como
hemos visto en el capítulo 13 es claro q la correlación no lineal puede ser
positiva o negativa.
Si no hay relación entre las variables como la figura 14.1(c), decimos que no
hay correlación entre ellas. (SPIEGEL, 1992)
Técnicas de correlación
A continuación abordaremos el estudio de dos variables y no solamente de
una, estudiaremos qué sentido tiene afirmar que dos variables están
relacionadas linealmente entre si y cómo podemos medir esta relación.
Relaciones lineales entre variables
Supongamos que dispongamos de dos pruebas de habilidad mental y la otra
pruebe de ingreso a la universidad, seleccionamos a cinco estudiantes que se
expresan en la tabla N° 1 con los puntajes obtenidos en estas dos pruebas.
La tabla nos dice que si podemos usar para pronosticar el puntaje alto en la
prueba de habilidad mental y también en los que tienen un puntaje alto en los
exámenes de admisión y los estudiantes con puntajes bajos en la en el examen
de habilidad como en el de admisión.
En circunstancias como la presente (cuando los puntajes altos de una variable
están relacionados con los puntajes altos de otra variable y los puntajes bajos
están relacionados con los puntajes bajos de otra variable) entonces podemos
asegurar que existe una relación positiva entre las dos variables.
Estudiantes X
Prueba de habilidad Mental
Y
Examen de Admisión
María
Olga
Susana
Aldo
Juan
18
15
12
9
3
82
68
60
32
18
Supongamos que en lugar de los resultados de la tabla N° 1 hubiera obtenido
los puntajes que se muestran en la tabla N°2 ¿Podremos afirmar que con estos
datos en esta situación en la prueba de habilidad pueda usarse para
pronosticarse los puntajes del examen de admisión?
También, aunque en este caso los puntajes altos apresen con un puntaje bajo,
tomando en cuenta esto podemos definir una relación lineal negativa entre el
conjunto.
Estudiantes X
Prueba de habilidad
Mental
Y
Examen de Admisión
María
Olga
Susana
Aldo
Juan
18
15
12
9
3
18
32
60
68
82
Estudiantes X
Prueba de habilidad
Mental
Y
Examen de Admisión
María
Olga
Susana
Aldo
Juan
18
15
12
9
3
18
82
68
60
32
En este caso no podemos afirmar una relación lineal entre las variables X y Y
ya que unos puntajes se acotejan con otros y no están en concordancia.
DIAGRAMA DE DISPERSIÓN
El diagrama de dispersión es útil para representar valores como lo
mostraremos a continuación utilizando los datos de la tabla N° 1, pero en la
vida real no todas las veces obtendremos datos de cinco parejas, tendremos
que comprender muchos más datos por esto es más sencillo utilizar un
diagrama para determinar la relación de los mismos.
COEFICIENTE DE CORRELACIÓN RECTILÍNEA DE PEARSON
Con la ayuda de las gráficas nos podemos formar una idea de la nube de
puntos o diagrama de dispersión, representa la relación lineal es positiva o
negativa y determinar la fuerza de relación.
El coeficiente de Pearson, toma valores entre -1 y +1, el coeficiente 0
demuestra que no existe correlación, así que independiente del número sea
negativo o positivo son iguales, claro está que entre más se aproxime al 1 o -1
mayor será la fuerza de relación.
EJERCICIO: CORRELACIÓN
El Banco Central del Ecuador nos presenta La siguiente informacion, la
cantidad y el precio del petroleo exportado por el Ecuador en los años 2008
hasta el 2011, se desea conocer si la informacion obtenida posee una
correlacion.
BANCO CENTRAL DEL ECUADOR
Año Meses
2008 2009 2010 2011
CANTI PRECIO CANTI PRECIO CANTI PRECIO CANTI PRECIO
Enero 11266 29,06 12427 46,69 10304 40,22 3383 76,44
Febrero 10193 32 11568 45,1 9210 46,29 5006 79,55
Marzo 11146 38,89 12428 46,8 10305 48,37 3502 85,49
Abril 10362 38,39 12577 54,67 9315 52,41 5494 91,25
Mayo 10761 35,95 10208 57,15 9224 53,78 5003 103,94
Junio 11521 42,26 10106 58,16 11842 56,94 4177 115,21
Julio 9744 46 9375 61,26 12239 63,73 3565 113,42
Agosto 10307 51,66 11206 59,29 10209 61,22 3989 99,13
Septiembre 10796 50,34 12310 49,34 10910 64,68 3630 87,47
Octubre 10001 45,43 11606 45 10605 71,36 3847 65,42
Noviembre 12569 40,33 12147 43,96 9214 79,81 2680 48,22
Diciembre 12929 42,76 10676 45,83 10722 77,21 5641 26,66
TOTAL 131595 493,07 136634 613,25 124099 716,02 49917 992,2
DESARROLLO
Paso 1: Escogemos la opción Analizar/Correlaciones/Bi-variadas
Paso 2 : Seleccionamos las variables con el botón
Escogemos la opción Pearson Clic en la opción Bilateral
Pasó 3 : Escoger la opción Marcar las correlaciones significativas Clic Aceptar
Paso 4 Aparece la tabla en la que constan los datos correspondientes a la
correlación.
Regresión lineal
Fases del modelo de regresión lineal
La recta de regresión y el coeficiente de correlación tienen sentido en tanto en
cuanto son instrumento para inferir la relación de las variables en la población.
El conocimiento exacto del coeficiente de correlación solo es posible si
analizamos la totalidad de la población. Sin embargo, a la hora de evaluarlo,
nos encontramos con el problema habitual de tener que inferirlo desde la
estimación que proporcionan los datos de una muestra.
La recta de regresión lineal y=a+bx, es una estimación de la recta de regresión
lineal de la población y=α+ßx. Los parámetros α y ß son evaluados a partir de
los datos de una muestra, y es fundamental tener unas garantías de que los
valores a y b estimados no difieren significativamente de los parámetros
poblacionales α y ß.
El proceso que se sigue en la construcción del modelo de regresión se
compone de tres fases o etapas. En la primera fase, se comprueba si la
relación entre las variables que componen el modelo está de acuerdo con la
propia forma del modelo.
La segunda fase consiste en la estimación de los parámetros de acuerdo con el
criterio elegido (en nuestro caso, el método de mínimos cuadrados).
La última fase es fundamental para el investigador, que debe comprobar si las
inferencias o pronósticos que se pueden hacer de la relación encontrada entre
las variables se ajustan a los datos. (VARGAS, 1995)
El modelo de regresión lineal
El modelo de regresión lineal simple es un proceso experimental en el que
intervienen dos variables: una variable dependiente Y, que no es controlada por
el experimento, y que depende de otra variable independiente X, que si es
controlada por el experimento, por lo que esta no es una variable aleatoria.
Para estudiar la relación de dependencia entre estas variables, se dispone de
una muestra aleatoria de tamaño N, que vamos a representar por {[x,y]}… n
Cuando tomamos distintas muestras para un mismo valor X, es de esperar que
varíen los correspondientes valores de Y; por ello, el valor y1 del par (x ,y) se
puede considerar como valor de una variable aleatoria por Y, que tendrá una
medida M(Y) y una varianza V(Y). (VARGAS, 1995)
Por lo tanto, para x=x, tenemos una variable aleatoria a la que vamos a
designar por Y, que tendrá una medida M (Y) y una varianza V(Y).
Admitir el modelo de regresión lineal supone aceptar que la medida de la
variable aleatoria M (Y), está relacionada linealmente con la variable x por
medio de la ecuación de la regresión de la población, es decir: (VARGAS,
1995)
Donde α y ß son los parámetros de la población.
M (Y) es la respuesta promedio; para simplificar la terminología, vamos a
designarla por P.
Los parámetros de la recta de regresión poblacional α y ß, son desconocidos y
deben ser estimados mediante los valores de a y b en la recta de regresión
muestral que se obtiene a partir de los datos de la muestra. (VARGAS, 1995)
Una vez evaluadas a y b, una estimación de la respuesta promedio P es:
EJERCICIO:
RELACIÓN LINEAL
Con los datos proporcionados por el Banco Central del Ecuador nos piden
encontrar una línea recta la cual acoja a todos los datos obtenidos de las
exportaciones de petróleo desde 2008 hasta el 2011 para de esta manera
elaborar pronósticos que se ajusten a los datos:
Año Meses
2008 2009 2010 2011
CANTI PRECIO CANTI PRECIO CANTI PRECIO CANTI PRECIO
Enero 11266 29,06 12427 46,69 10304 40,22 3383 76,44
Febrero 10193 32 11568 45,1 9210 46,29 5006 79,55
Marzo 11146 38,89 12428 46,8 10305 48,37 3502 85,49
Abril 10362 38,39 12577 54,67 9315 52,41 5494 91,25
Mayo 10761 35,95 10208 57,15 9224 53,78 5003 103,94
Junio 11521 42,26 10106 58,16 11842 56,94 4177 115,21
Julio 9744 46 9375 61,26 12239 63,73 3565 113,42
Agosto 10307 51,66 11206 59,29 10209 61,22 3989 99,13
Septiembre 10796 50,34 12310 49,34 10910 64,68 3630 87,47
Octubre 10001 45,43 11606 45 10605 71,36 3847 65,42
Noviembre 12569 40,33 12147 43,96 9214 79,81 2680 48,22
Diciembre 12929 42,76 10676 45,83 10722 77,21 5641 26,66
TOTAL 131595 493,07 136634 613,25 124099 716,02 49917 992,2
DESARROLLO
Paso 1 Clic en la opcion Gráficos/ Cuadro de diálogos antiguos/ Dispercion de
puntos
Elejimos la dispercion simple
En donde nos da como resultado el siguiente cuadro
Paso 2 Colocamos las variables en el eje de la X & Y dependiendo de los datos
del problema a resolver, dando como resultado el siguiente cuadro:
Si queremos encontrar la línea de correlación click en gráficos/cuadros de
dialogo antiguo/ lineas
Uniendo
ENCONTRAR LA ECUACIÓN
Paso 1 Escogemos la opción Analizar de la barra de herramientas/ Regresión/
Lineales
Paso 2 Elegimos la variable dependiente e independiente según corresponda;
después clic en la opción Estadísticos.
Paso 3 Se escoge las siguientes opciones de la ventana, Estimaciones, Ajuste del
modelo, Cambio en R cuadrado y Descriptivos clic en Continuar.
Paso 4 Clic en Aceptar
Paso 5 Nos aparecen los resultados del estadístico en donde podemos deducir
que la fórmula de la recta de los datos es:
F (x)= -20.183x+11795,561
Prueba de hipótesis
La prueba de hipótesis comienza con una suposición, llamada hipótesis, que
hacemos acerca de un parámetro de población. Después recolectamos datos
de muestra, producimos estadísticas muéstrales y usamos esta información
para decidir qué tan probable es que nuestro parámetro de población hipotético
sea correcto. Digamos que suponemos un cierto valor para una medida de
población, para probar validez de esa suposición recolectamos datos de
muestra y determinamos la diferencia entre el valor hipotético y el valor real de
la media de la muestra. Después juzgamos si la diferencia obtenida es
significativa o no. Mientras más pequeña sea la diferencia, mayor será la
probabilidad de que nuestro valor hipotético para la media sea correcto.
Mientras mayor sea la diferencia, más pequeña será la probabilidad. (LEVIN,
2010)
Hipótesis nula y alternativa
La prueba de hipótesis empieza con algo de teoría, afirmación o aserción con
respecto a un parámetro particular de una población. Para fines de análisis
estadístico, el gerente de producción escoge como hipótesis inicial que el
proceso está bajo control; esto es, el contenido promedio es de 368 gramos y
no es necesario efectuar acciones correctivas. La hipótesis de que el parámetro
de la población es igual a la especificación de las compañías se conoce como
la hipótesis nula.
Una hipótesis nula es siempre una de status quo o de no diferencia. Por lo
general se le identifica con el símbolo Ho. Nuestro gerente de producción
establecería como hipótesis nula que el proceso de llenado está bajo control y
funcionando apropiadamente, que la cantidad media de cereal por caja es la
aplicación de la compañía de 368 gramos. Esto se establece como:
Ho2 µ=0
Siempre que especifiquemos una hipótesis nula, también debemos especificar
una hipótesis alternativa o una que debe ser verdadera si se encuentra que la
hipótesis nula es falsa. La hipótesis alternativa (H1) es lo opuesto a la hipótesis
nula (Ho). Para el gerente de producción, la hipótesis alternativa se puede
establecer como:
Ho2 µx≠0
La hipótesis alternativa representa la conclusión a la que se llegaría si hubiera
suficiente evidencia de la información de la muestra para decidir que es
improbable que la hipótesis sea verdadera y, por tanto rechazarla. En nuestro
ejemplo, si el peso de las cajas muestreadas estuvieran lo suficiente por arriba
o por debajo del promedio.
Interpretación del nivel de significancia
El propósito del nivel de significancia no es cuestionar el valor calculado en el
estadístico de la muestra sino hacer un juicio respecto a la diferencia entre ese
estadístico y un parámetro hipotético de la población.
Si suponemos que la hipótesis es correcta, entonces el nivel de significancia
indicará el porcentaje de medias muéstrales que está fuera de ciertos límites.
Selección del nivel de significancia
No existe un nivel de significancia único estándar o universal para probar
hipótesis. En algunos casos se utiliza el nivel de significancia de 5%. Ciertos
resultados de investigaciones publicados a menudo prueban hipótesis para un
nivel de significancia del 1%. Es posible probar una hipótesis a cualquier nivel
de significancia.
Cuando más alto sea el nivel de significancia que utilizamos para probar una
hipótesis, mayor será la probabilidad de rechazar la hipótesis nula cuando es
cierta. (LEVIN, 2010)
Error tipo I y Error tipo II
Rechazar una hipótesis nula cuando es cierta se denomina error tipo I, y su
probabilidad se simboliza con α (alfa). Por otro lado, aceptar una hipótesis nula
cuando es falsa se llama Error tipo II, y su probabilidad se simboliza con ß
(beta).
Existe relación entre estos dos tipos de errores: la probabilidad de cometer un
tipo de error puede reducirse solo si estamos dispuestos a aumentar la
probabilidad de cometer el otro tipo de error. (LEVIN, 2010)
Pasos de una prueba de hipótesis
En la prueba de hipótesis que goza de aceptación general figuran siete pasos:
Paso 1 Formular la hipótesis nula HO,
De manera que pueda determinarse exactamente α, la probabilidad de
cometer un error tipo 1. (Esto equivale a determinar el parámetro de población
que interesa y proponer la validez de un valor para él) (Signo =)
Formular la hipótesis alternativa Ha
De manera que el rechazo de la hipótesis nula signifique aceptar la hipótesis
alternativa. (Signo > o <)
Al formular estas dos hipótesis, se determinan el parámetro y el valor
propuesto;
Paso 2 Determinar si la prueba es unilateral o bilateral
Paso 3 Asumir el nivel de significación
Paso 4 Determinar la distribución muestral que se usara en la prueba
Paso 5 Elaborar el esquema de la prueba
Paso 6 Calcular el estadístico de la prueba
Paso 7 Tomar la decisión, para esto, se comparan el esquema de la parte 5,
con el estadístico del paso 6
T DE STUDENT
En probabilidad y estadística, la distribución t-Student es una distribución de
probabilidad que surge del problema de estimar la media de una población
normalmente distribuida cuando el tamaño de la muestra es pequeño.
Una variable aleatoria se distribuye según el modelo de t-Student con n grados
de libertad.
Propiedades:
1. La gráfica de la función de densidad es en forma de campana.
2. Los datos están más disperso que la curva normal estándar.
3. A medida que n aumenta, la gráfica se aproxima a la normal N(0,1).
4. La gráfica es muy parecida a la de la normal estándar diferenciándose
en que las colas de t están por encima de la normal, y el centro se
encuentra por debajo del de la normal.
5. Cuando los grados de libertad son altos, los valores de t coinciden con
los de la normal.
EJERCICIO
Paso 1 Elegimos la opción analizar, donde se despliega otra ventana y
seleccionamos prueba T para una muestra.
Paso 2 Trasladamos la variable precio hacia la ventana derecha, y elegimos
aceptar, esperamos un momento y obtendremos los resultados.
Paso 1 Escoger la opción Análisis/Regresión/Lineales
Paso 2 Se escoge la variable dependiente e independiente según sea el caso
de los datos. Clic en la opción Gráficos
Paso 3 En la sección de colocar la variable X se utiliza DEPENDENT y para
ubicar Y se utiliza la opción *ZPRED, a la vez se escoge las opciones
histograma y grafico de prob. Normal. Clic en Continuar
Paso 4 Clic en Aceptar
Paso 5 Después de comparar los grados de libertad en el ejercicio además del
nivel de confianza podemos determinar si el resultado del estadístico se
encuentra dentro del rango de aceptación o rechazo.
Chi- cuadrado
Pruebas paramétricas
Se llaman así a las pruebas de hipótesis que cumplen tres requisitos
fundamentales:
1 La variable de la prueba debe ser variable cuantitativa.
1 los datos se obtienen por muestreo estadístico.
2 Los datos deben ajustarse a determinadas distribuciones estadísticas.
Ejemplo
1) La prueba basada en la distribución normal de probabilidades.
2) La prueba de student.
Pruebas no paramétricas
Llamadas también pruebas de distribución libre son aquellas en que:
1 la variable de la prueba debe ser cualitativa o cuantitativa
2 los datos se obtienen pos muestreo estadístico
3 son independientes de cualquier distribución de cualquier probabilidad.
Ejemplo
La prueba del chi-cuadrado
Las pruebas paramétricas son más poderosas sin embargo cuando la variable
es cualitativa, solo se puede usar las pruebas no paramétricas.
Estadístico chi-cuadrado
Es un estadístico que sirve de base para una prueba no paramétrica
denominada prueba de chi cuadrado que se utiliza especialmente para
variables cualitativas, esto es, variables que carecen de unidad y por lo tanto
sus valores no pueden expresarse numéricamente. Los valores de estas
variables son categorías que solo sirven para clasificar los elementos del
universo del estudio. También puede utilizarse para variables cuantitativas,
transformándolas, previamente, en variables cualitativas ordinales.
El estadístico Chi- Cuadrado se define por:
En donde:
n=número de elementos de la muestra
n-1= números de grados de libertad.
=varianza de la muestra
= varianza de la población
EJERCICIO:
Paso1 Clic en analizar, seleccionar la opción tablas de contingencia.
Paso 2 Trasladamos las variables precio y volumen a la parte derecha, y
hacemos clic en estadísticos.
Paso 3 En la ventana que se despliega escogemos la opción chi-cuadrado y
hacemos clic en continuar.
Paso 4 Cumplido los pasos anteriores, finalmente hacemos clic en aceptar
para obtener los resultados de este estadístico.
Paso 1 Escoger la opción Análisis/Regresión/Lineales
Paso 2 Se escoge la variable dependiente e independiente según sea el caso
de los datos. Clic en la opción Gráficos.
Paso 3 En la sección de colocar la variable X se utiliza DEPENDENT y para
ubicar Y se utiliza la opción *ZPRED, a la vez se escoge las opciones
histograma y grafico de prob. Normal. Clic en Continuar
Paso 4 Clic en Aceptar
Paso 5 Después de comparar los grados de libertad en el ejercicio además del
nivel de confianza podemos determinar si el resultado del estadístico se
encuentra dentro del rango de aceptación o rechazo.
Varianza
Cuando es necesario hacer comparaciones entre tres o más medias
muéstrales para determinar si provienen de poblaciones iguales utilizamos la
técnica de análisis de varianza. Esta técnica se realiza utilizando la distribución
de probabilidad F vista anteriormente. Para el uso de esta técnica es necesario
seguir los siguientes supuestos:
1) Las poblaciones siguen una Distribución de Probabilidad Normal
2) Las poblaciones tienen desviaciones estándar (σ) iguales
3) Las muestras se seleccionan de modo independiente
La técnica del análisis de varianza descompone la variación total en dos
componentes de variación llamados variación debida a los tratamientos y
variación aleatoria.
Cuando estamos frente a un problema de análisis de varianza lo primero que
debemos hacer es identificar en términos del problema lo siguiente:
Variable dependiente o variable respuesta: Es la variable que nos interesa
medir o respuesta que se va a estudiar para determinar el efecto que tiene
sobre ella la variable independiente.
Variable independiente o factor: Es la variable o factor que puede influenciar
en la variabilidad de la respuesta o variable dependiente.
Nivel o tratamiento del factor: Es un valor o condición del factor bajo el cual
se observa la respuesta medible.
Unidad experimental: Es el objeto (persona, animal o cosa) donde se aplica
un determinado tratamiento, para obtener una medición de la variable
respuesta.
Error experimental: Es la variación que no se puede atribuir a un cambio de
tratamiento; es decir, la que se produce por los factores extraños que pueden
influir en la respuesta y que deben ser eliminados o controlados por el
investigador.
Aleatorización: Consiste en asignar en forma aleatoria los tratamientos a las
unidades experimentales con el propósito de remover los posibles sesgos
sistemáticos y neutralizar los efectos de todos aquellos factores externos que
no se encuentran bajo el control del investigador, pero pueden estar presentes
en el experimento.
Nosotros estudiaremos el diseño Completamente Aleatorizado con un solo
factor o un factorial.
Este modelo es apropiado en aquellas situaciones donde se tiene un solo factor
o variable independiente con “c” niveles o tratamientos.
Ejercicio
Paso 1 Se selecciona la opción analizar, se desplegara otra barra donde se
escogerá la opción frecuencias.
Paso 2 Se traslada la variable dependiente a la parte derecha, posteriormente
hacemos chic en la opción estadísticos.
Paso 3 En esta ventana hacemos clic en varianza y luego clic en continuar.
Paso 4 Para obtener finalmente los resultados hacemos clic en la opción
aceptar, y enseguida saldrán los resultados.
ABSTRACT
When testing hypotheses, we start from an assumed value (hypothetical) in the
population parameter. After collecting a random sample, comparing the
statistical sample, as well as the average (x), with the hypothetical parameter is
compared with an assumed population mean. Then accepted or rejected the
notional value, as appropriate. Notional value is rejected only if the sample
result is very unlikely if the hypothesis is true.
A statistical test is a method, based on a random sample and meaningful,
allowing conclusions to accept or reject a hypothesis previously issued on the
value of an unknown parameter of a population.
Statistically a hypothesis test is any statement about a population and / or its
parameters.A hypothesis test is to contrast two statistical hypotheses. This
contrast involves making decisions about the hypothesis. The decision is to
reject or not a hypothesis in favor of the other. A statistical hypothesis is
denoted by “H” and is two:
- Ho: null
- H1: alternative hypothesis