20.pdf · Muestreo bietapico Metodos de muestreo no probabilisticos Introducci6n Una gran

Transcript

Otros temas relacionados con el muestreo

/// Esquef1U1 del capitulo

20.1. Pasos basicos de un estudio realizado por muestreo 20.2. Errores de muestreo y errores ajenos al muestreo 20.3. Muestreo aleatorio simple

Analisis de los resultados de un muestreo aleatorio simple 20.4. Muestreo estratificado

Analisis de los resultados de un muestreo aleatorio estratificado Afijaci6n del esfuerzo muestral a los distintos estratos

20.5. Elecci6n del tamano de la muestra Tamano de la muestra para el muestreo aleatorio simple: estimaci6n de la media o total poblacional Tamano de la muestra para el muestreo aleatorio simple: estimaci6n de la proporci6n poblacional Tamano de la muestra para un muestreo aleatorio estratificado con un grado de precisi6n especificado

20.6. Otros metodos de muestreo Muestreo por conglomerados Muestreo bietapico Metodos de muestreo no probabilisticos

Introducci6n

Una gran parte de la inferencia estadfstica se refiere a problemas en los que se hacen afirmaciones sobre una poblaci6n basandose en informaci6n procedente de una muestra. Hasta ahora hemos tratado de una manera bastante superficial dos importantes temas. En primer lugar, apenas nos hemos referido a la forma en que se seleccionan real mente los miembros de la muestra. En segundo lugar, hemos supuesto en general que el numero de miembros de la poblaci6n es muy grande en comparaci6n con el numero de miembros de la muestra. En este capitulo examinamos el problema del investigador que quiere descubrir algo sobre una poblaci6n que no es necesaria mente grande. EI investigador pretende reunir informaci6n unicamente sobre un subconjunto de la poblaci6n y necesita orientaci6n para saber c6mo debe reunirla.

Page 2: Otros temas relacionados con el muestreo - Bibliotecabiblio3.url.edu.gt/Libros/2012/esta-AE/20.pdf · Muestreo bietapico Metodos de muestreo no probabilisticos Introducci6n Una gran

812 Estadistica para administracion y economia

20.1. Pasos basicos de un estudio realizado por muestreo Los analistas de mercado a menudo estudian las poblaciones humanas para obtener informacion sobre sus preferencias por un producto. Los auditores normal mente seleccionan una muestra de facturas pendientes de cobro de una empresa. Se hacen inferencias sobre la poblacion correspondiente basandose en estas muestras. Los directores de personal requieren informacion sobre las actitudes de los empleados hacia los nuevos metodos de produccion propuestos y les resulta util tomar una muestra de la plantilla. Naturalmente, el uso de metodos de muestreo esta muy extendido y va mas alla del campo de la empresa. Tal vez los ejemplos mas conocidos sean las encuestas que se hacen periodicamente sobre las preferencias de los votantes antes de las elecciones. La informacion recogida tiene interes no solo para el publico en general sino tambien para los asesores de los candidatos que tratan de averiguar donde deb en concentrar mas los esfuerzos. Esas encuestas a los votantes han aumentado tanto que se recaba la opinion de los votantes sobre todos los aspectos de la polftica y los encuestadores profesionales se han convertido en una importante figura en el sequito del politico.

Antes de preguntar como debe tomarse una muestra de una poblacion, tal vez se pregunte el lector por que hay que to mar una muestra. La alternativa es intentar obtener informacion de todos los miembros de la poblacion. En ese caso, hablarfamos de censa y no de muestra. Hay varias razones por las que a menudo se prefiere una muestra a un censo. En primer lugar, en muchas aplicaciones serfa enormemente caro tomar un censo completo, a menudo prohibitivo. En segundo lugar, muchas veces es necesario disponer de informacion bastante deprisa; un censo completo, incluso aunque sea economicamente viable, puede tardar tanto en realizarse que el valor de los resultados puede disminuir seriamente. Otra razon para tomar una muestra es que con los metodos estadisticos modernos generalmente es posible obtener resultados con el grado deseado de precision por medio del muestreo. El tiempo y el dinero necesarios para obtener numeros cuya precision aparente es mayor que la que necesita el investigador podrfan dedi carse mejor a otras cosas. Ademas, si se toma una muestra relativamente pequefia, los beneficios que se obtendrian haciendo un esfuerzo mayor para conseguir informacion precisa de los rniembros de la muestra podrfan muy bien ser mayores que los beneficios de obtener informacion de un grupo mayor que puede ser menos fiable debido a las limitaciones de tiempo y de costes. En cuarto lugar, algunos muestreos son destructivos y los sujetos contrastados se destruyen en el estudio. As! sucederfa si se tratara de contrastar la duracion de las bombillas, la duracion de una determinada marca de neumaticos 0 la resistencia de los tubos de vidrio a las roturas. Estos factores -coste, tiempo, precision y caracter destructivo- considerados en conjunto llevan a preferir en much as ocasiones las muestras a los censos.

Supongamos ahora que se necesita informacion sobre una poblacion y que se ha decidido tomar una muestra. Es comodo considerar que un estudio realizado por muestreo consta de los seis pasos siguientes, cada uno destinado a dar una respuesta a una pregunta. La Figura 20.1 muestra estos pasos.

1. Primer paso: (,que informacion se necesita? 2. Segundo paso: (,cual es la poblacion relevante y existe un listado de esa poblacion? 3. Tercer paso: (,como deben seleccionarse los miembros de la muestra? 4. Cuarto paso: (,como debe obtenerse informacion de los rniembros de la muestra? 5. Quinto paso: (,como debe utilizarse la informacion muestral para hacer inferencias

sobre la poblacion? 6. Sexto paso: (,que conclusiones pueden extraerse sobre la poblacion?

Page 3: Otros temas relacionados con el muestreo - Bibliotecabiblio3.url.edu.gt/Libros/2012/esta-AE/20.pdf · Muestreo bietapico Metodos de muestreo no probabilisticos Introducci6n Una gran

Capitulo 20. Otros temas relacionados can el muestreo 813

Figura 20.1. PasoS en un estudio realizado por rnuestreo.

Sexto paso: lconclusiones?

Quinto paso: linferencias de la muestra?

Cuarto paso: lobtener informacion?

Tercer paso: lseleccion de la muestra?

Segundo paso: lPoblacion relevante?

Primer paso: linformacion necesaria?

Se analiza cada uno de esos pasos en relacion con un problema de un estudio de mercado. Supongamos que un editor pretende publicar un nuevo libro de texto de estadistica y qui ere informacion sobre la situacion actual del mercado. La informacion valiosa podria ser el numero de estudiantes matriculados en los cursos de estadistica para los negocios, la penetracion de los textos existentes en el mercado y las opiniones de los profesores sobre los temas que son mas importantes para sus cursoS. Supongamos que el editor quiere recogel' datos de una muestra de campus universitarios.

1. l.Que informacion se necesita?

La respuesta a esta pregunta es tanto el motivo como el punto de partida para realizar el estudio. Si la informacion necesaria ya existe 0 es imposible de obtener, no tiene sentido realizar el estudio. Por muy sencilla que parezca la pregunta, a menu do es necesario lograr un equilibrio bastante delicado en esta fase. El investigador puede estar pensando en un unico tema 0 puede haber varios temas de interes . Pero dado que va a realizarse el estudio, con todos sus costes, normalmente merece la pena preguntarse si puede obtenerse en el estudio mas informacion potencial mente util con un gasto adicional minimo. En el caso del editor del libro de estadfstica para los negocios, las preguntas mas Miles se refieren al tamafio del mercado, a la situacion de los competidores y a los temas que los profesores consideran mas importantes. Dado que hay que entrar en contacto con los miembros de la muestra para recabar esta informacion, puede merecer la pena hacer algunas preguntas mas. Estas pueden ser si el curso es de un cuatrimestre 0 de dos, si es optativo u obligatorio, el departamento del profesor, el metoda para adoptar el libro y el tiempo que !leva utilizandose el libro actual. Una vez elegido ese camino, se puede tener la tentacion de dejar que la lista de preguntas au mente espectaclllarmente, ya que eso generalmente no incrementa mucho el coste del estudio. Sin embargo, puede tener un problema. Es mas probable que los encuestados cooperen en un estudio en el que se hacen relativamente pocas preguntas, ya que se les qllita poco tiempo. Es importante, pues, para el investigador buscar el equilibrio, es decir, hacer preguntas sobre cuestiones centrales (pues, si se descubre una omision importante, puede ser demasiado caro repetir to do el ejercicio) y conseguir que el numero de preguntas sea tolerable para los encuestados.

Page 4: Otros temas relacionados con el muestreo - Bibliotecabiblio3.url.edu.gt/Libros/2012/esta-AE/20.pdf · Muestreo bietapico Metodos de muestreo no probabilisticos Introducci6n Una gran

814 Estadfstica para administracion y economfa

2. l,Cual es la poblacion relevante y existe un listado de esa poblacion?

Parece bastante trivial sefialar que para hacer inferencias sobre una poblacion, esa es la poblacion que debe muestrearse. No obstante, a menudo se han extraido dudosas conclusiones tras un amilisis, por 10 demas absolutamente respetable, de los datos de encuesta precisamente porque no se ha tenido en cuenta este punto elemental. Muchas publicaciones piden la opinion de sus lectores sobre determinadas cuestiones. Sin embargo, seria peligroso generalizar sus respuestas a la poblacion en general. La poblacion estudiada en este caso es simplemente la de lectores de la publicacion y es probable que estos lectores no sean representativos del publico en general. En muchos estudios practicos, la poblacion real de interes puede ser imposible de definir. Por ejemplo, una organizacion que intenta predecir el resultado de un as elecciones presidenciales solo esta interesada realmente en la poblacion que votara. Aunque esta es la poblacion relevante, sus miembros no son faciles de distinguir. Una posibilidad es, por supuesto, preguntar a un miembro de una muestra si tiene intencion de votar. Si embargo, es bien sabido que la proporcion que responde afirmativamente a una pregunta de ese tipo es mayor que la proporcion que acaba votando. Otra posibilidad es preguntar si el encuestado voto en las elecciones anteriores, pero esta pregunta tambien dista de ser totalmente satisfactoria.

Es probable que el editor del libro de texto considere que la poblacion relevante son todos los profesores (0 quiza todas las universidades) que imparten cursos de estadistica para los negocios. La poblacion es bastante facil de identificar y, como consecuencia de actividades de marketing anteriores, el editor tendra casi con toda seguridad un listado bastante preciso de sus miembros.

3. l,Como deben seleccionarse los miembros de la muestra?

Una gran parte del resto de este capitulo se dedica a responder a esta pregunta. En pocas palabras, no existe una unica forma de conseguir el «mejor» sistema de muestreo. La eleccion correcta depende generalmente del problema en cuestion y de los recursos del investigador. Ya hemos introducido anteriormente el concepto de muestreo aleatorio simple, en el que todos los miembros de una poblacion tienen la misma probabilidad de ser elegidos para la muestra. De hecho, todos los instrumentos para analizar los datos que hemos introducido hasta ahora se basaban en el supuesto de que la muestra se elegia de esta forma. Existen, sin embargo, muchas circunstancias en las que podria preferirse otro sistema de muestreo. Supongamos que a nuestro editor Ie interesan las diferencias entre el tratamiento que se da a la estadfstica empresarial en las escuelas universitarias de grado medio y el que se Ie da en las facultades de grado superior. Serfa importante que la muestra contuviera suficientes centros de cada tipo para po del' extraer conclusiones fiables sobre ambos. Sin embargo, el muestreo aleatorio simple no garantiza en modo alguno que se logre ese objetivo. POl' ejemplo, es absolutamente posible que la muestra elegida contenga una preponderancia de facultades. Para evitar esta posibilidad, pueden extraerse muestras aleatorias simples de las respectivas poblaciones de los dos tipos. Este es un ejemplo de muestreo estratificado, que se analiza mas detalladamente en el apartado 20.4. Otra cuestion que hay que decidir en esta fase es el numero de miembros de la muestra. En este caso, la eleccion depende esencialmente del grado de precision necesario y de los costes que implica. Esta cuestion se aborda en el apartado 20.5.

Page 5: Otros temas relacionados con el muestreo - Bibliotecabiblio3.url.edu.gt/Libros/2012/esta-AE/20.pdf · Muestreo bietapico Metodos de muestreo no probabilisticos Introducci6n Una gran

Capitulo 20. Otros temas relacionados can el muestreo 815

4. l,Como debe obtenerse informacion de los miembros de la muestra?

Esta pregunta es extraordinariamente importante y ha sido objeto de muchas investigaciones. En terminos generales, plantea dos importantes cuestiones. En primer lugar, el investigador quiere obtener respuestas de la mayor proporcion posible de los miembros de la muestra. Si el numero que no responde es alto, sera diffcil estar segura de que los que han respondido son representativos de la poblacion en general. Por ejemplo, los profesores que no facilitan informacion al editor del libro de texto pueden estar mas dedicadas a la investigacion, a la consultoria 0 a otras actividades y sus preferencias sabre los libros pueden muy bien ser diferentes de las de sus colegas. Recuerdese que el numero de preguntas formuladas en una encuesta puede afectar a la tasa de respuesta. Tambien influye la forma en que se conlacla can los miembros de la muestra. A menudo los cuestionarios sc envian por correo a las personas seleccionadas para la muestra y a menudo ocurre que la proporcion que responde es decepcionantemente baja. Muchos investigadores intentan mejorar la tasa de respuesta adjuntando una carta en la que explican los fines del estudio y solicitan ayuda educadamente. La garantia del anonimato tambien puede ser valiosa. La inclusion de un sobre con el franqueo pagado para devolver el cuestionario general mente merece la pena; tambien puede prometerse algun pequeno incentivo monetario 0 regalo. No obstante, habra casi inevitablemente una proporcion de personas que no respondan y es una buena practica instituir un estudio de seguimiento para tratar de obtener mas informacion sabre elias. Es probable que los metodos de contacto mas caros, como las lIamadas telefonicas 0 las visitas de los entrevistadores a las casas, logren un nivel de respuesta mas alto. Sin embargo, esos metodos pueden ser caros en tiempo y dinero y la decision de como recoger informacion debe depender de los recursos del investigador y del grado en que se piense que la falta de respuesta puede ser un problema serio.

El editor del libro de texto puede decidir enviar cuestionarios por correo a los miembros de la muestra. Seria barato, por 10 que podrfa extraerse una muestra inicial relativamente grande. La esperanza es que la proporcion de personas que no rcsponden no sea demasiado alta y que las respuestas obtenidas sean razonablemente representativas. Si se teme que la falta de respuesta introduzca un sesgo considerable si se envfa un cuestionario pOl' correo, se podria tomar una muestra inicial mas pequena y hacer un esfuerzo mayor para contactar con sus miembros. Una estrategia viable es pedir a los representantes de la empresa, que visitan periodicamente los campus, que realicen entrevistas con miembros de la muestra en su siguiente visita. Ese metoda deberfa garantizar una tasa de respuesta bastante alta. Su principal dificultad estriba en el tiempo necesario para realizar todas las entrevistas mas que en el coste adicional, que serfa bastante bajo.

El segundo punto es obtener respuestas que sean 10 mas exactas y sinceras posible. No sirve de nada hacer un sofisticado analisis estadistico de informacion que no es fiable . Formular las preguntas, ya sea para enviarlas pOl' correo 0 para que las realice un encuestador, de tal forma que se consigan respuestas sinceras y exactas es to do un arte. Es importante que las preguntas se formulen de la manera mas clara e inequivoca posible, de modo que los sujetos entiendan 10 que se les pregunta. Tambien se sabe perfectamente que la formulacion de las preguntas 0 el tono del entrevistador pueden inducir a los encuestados a dar determinadas respuestas. Los entrevistadores no deben dar en modo alguno la impresion de que tienen firmes ideas sobre el tema en cuestion 0 de que quieren una respuesta concreta. Tambien es importante no predisponer a los encuestados: las preguntas deben formularse de la forma mas neutral posible. Por poner un ejemplo extremo, consideremos los dos metodos siguientes para preguntar esencialmente 10 mismo:

Page 6: Otros temas relacionados con el muestreo - Bibliotecabiblio3.url.edu.gt/Libros/2012/esta-AE/20.pdf · Muestreo bietapico Metodos de muestreo no probabilisticos Introducci6n Una gran

816 Estadfstica para administraci6n y economfa

a) i, Que tres temas considera mas importantes en su curso de estadfstica para los negocios?

b) i,Esta de acuerdo en que los metodos modernos de gestion de la calidad, debido a su enorme importancia en el mundo de la empresa, ahora deben considerarse uno de los mas importantes en cualquier curso de estadistica para los negocios?

Naturalmente, nadie que tenga interes en tener una idea precisa de las opiniones de los profesores haria la segunda pregunta. Sin embargo, se ha observado que formulaciones que tienen un sesgo mucho menos claro que el de esta influyen significativamente en las respuestas de los sujetos.

5. {,Como debe utilizarse la informacion de la muestra para hacer inferencias sobre la poblacion?

Hemos dedicado la mayor parte de este libro a dar respuesta justamente a esta pregunta. En los apartados posteriores de este capitulo, analizamos metodos de inferencia de disefios de muestreo especfficos. El objetivo principal del presente apartado es sefialar la importancia de otros aspectos de un estudio por muestreo.

6. {,Que conclusiones pueden extraerse sobre la poblacion?

Por ultimo, cerramos el cfrculo y preguntamos que puede decirse sobre la poblacion estudiada como consecuencia de una investigacion estadfstica. i,Ha dado el estudio claras respuestas a las preguntas que 10 motivaron? i,Han surgido otras cuestiones importantes en el curso del estudio? En esta fase, el investigador tiene la tarea de resumir y presentar la informacion recogida. Para eso pueden ser necesarias estimaciones puntuales 0 por intervalos, asf como tablas 0 gr:ificos que resuman los principales resultados. i,Cu:il es la mejor estimacion del numero de estudiantes matriculados en los cursos de estadistica para los negocios y pueden estimarse intervalos de confianza en torno a esta estimacion? i,Cuales son los libros de texto mas populares en este momento? i,Que temas consideran mas importantes los profesores? i,Existen diferencias significativas entre los mercados de las escuelas universitarias y las facultades? En esta fase, la tarea es informar sobre los resultados del estudio y decidir como proceder. Puede que el analisis sugiera la conveniencia de recoger mas informacion.

A menudo surgen importantes cuestiones imprevistas durante el curso del estudio que inducen al investigador a estudiar en mayor profundidad la poblacion. Esta es la razon por la que nuestro editor hace una pregunta abierta como la siguiente: «Nuestra empresa esta considerando la posibilidad de introducir en el mercado un nuevo libro de texto de economfa. i,Hay alguna caracterfstica que Ie gustarfa que tuviera ese libro?». Supongamos, ademas, que cuando se devuelven los cuestionarios, un numero considerable menciona la posibilidad de que se venda simultaneamente una gran base de datos que contenga datos sobre problemas reales del mundo de la empresa. Analizando estos datos, los estudiantes podrfan adquirir experiencia practica en temas del curso. Antes de incurrir en el coste de producir este program a informatico, al editor podrfa merecerle la pena tomar otra muestra para evaluar las probabilidades de exito de este proyecto.

Page 7: Otros temas relacionados con el muestreo - Bibliotecabiblio3.url.edu.gt/Libros/2012/esta-AE/20.pdf · Muestreo bietapico Metodos de muestreo no probabilisticos Introducci6n Una gran

Capitulo 20. Otros temas relacionados con el muestreo 817

EJERCICIOS

Ejercicios basicos 20.1. Suponga que quiere realizar un estudio para co

nocer las opiniones de los estudiantes de administracion de empresas de su campus sobre la necesidad de que la asignatura de estadistica sea obligatoria. Analice los pasos que seguirfa para realizar este estudio, los problemas que esperarfa encontrar y las tecnicas que podrfa utilizar para resolver los problemas.

20.2. Las autoridades universitarias tienen interes en conocer las opiniones de los estudiantes sobre algunos servicios universitarios (como la matrfcula, los comedores 0 el servicio medico). Le han pedido que haga una encuesta. Sugiera como seguirfa los seis pasos de un estudio de muestreo.

20.3. El director de una tienda de ropa situ ada en el campus esta considerando la posibilidad de introducir algunos artfculos mas de marca y quiere evaluar la demanda de estos artfculos por parte de los estudiantes. Se Ie ha encargado que disene una encuesta para obtener esta informacion. Explique detalladamente 10 que haria.

20.4. Una empresa de servicios financieros esta considerando la posibilidad de introducir tres nue-

vos tipos de fondos de inversion . Se cree que, al menos inicialmente, la mayor parte del apoyo probablemente provendria de sus clientes actuales. A la empresa Ie gustarfa evaluar el grado de interes que tienen estos clientes en los nuevos productos propuestos y preferiblemente conocer tambien las caracterfst icas re levantes de las personas mas interesadas. Le han encargado un estudio con un presupuesto limitado. ~Que haria?

20.5. A los ejecutivos de una companfa de seguros, conscientes de que han aumentado significativamente algunos tipos de prim as de seguro en los ultimos anos, les preocupa la imagen publica de su sector y la posibilidad de que tenga repercusiones poifticas. Se ha decidido lanzar una campana de relaciones publicas para informar al publico sobre las causas de los incrementos de los costes. Sin embargo, existe mucha incertidumbre sobre los temas que mas preocupan a la gente y sobre el grado en que se comprenden los factores que subyacen a las subidas de los precios. Explique como pod ria organizar un estudio para obtener informacion relevante. Siga los pasos basicos de un plan de muestreo.

20.2. Errores de muestreo errores ajenos al muestreo

Cuando se toma una muestra de una poblacion, no es posible saber cwil es exactamente el valor de cualquier parametro poblacional, como la media 0 la proporcion. Cualquier estimacion puntual tendni inevitablemente un error. Recuerdese que una de las fuentes de error, llamado error de muestreo, se debe a que s610 se dispone de informaci6n sobre un subconjunto de todos los miembros de la poblaci6n. Dados ciertos supuestos, la teorfa estadfstica nos permite caracterizar la naturaleza del error de muestreo y hacer afirmaciones probabilfsticas bien definidas sobre los panimetros poblacionales, como los intervalos de confianza analizados en los Capftulos 8 y 9. En apartados posteriores de este capitulo, analizamos metodos de inferencia estadfstica para varios sistemas importantes de muestreo. Sin embargo, es importante reconocer primero otra fuente posible de error, que no puede analizarse de una forma tan exacta 0 clara.

En los amilisis pnicticos, puede haber errores que no tengan que ver con el tipo de sistema de muestreo utilizado. De hecho, esos errores podrfan cometerse tambien si se tomara un censo completo de la poblaci6n. Son errores ajenos al muestreo. En cualquier encuesta, existe la posibilidad de que haya en algunos lugares un error ajeno al muestreo. He aqui algunos ejemplos:

1. La poblacion de la que se hace realmente el muestreo no es la relevante. En 1936, ocurri6 un conocido caso de este tipo, cuando la revista Literary Digest pre-

Page 8: Otros temas relacionados con el muestreo - Bibliotecabiblio3.url.edu.gt/Libros/2012/esta-AE/20.pdf · Muestreo bietapico Metodos de muestreo no probabilisticos Introducci6n Una gran

818 Estadistica para administraci6n y economia

dijo con seguridad que Alfred Landon ganarfa las elecciones frente a Franklin Roosevelt. Sin embargo, Roosevelt gano por un amplio margen. Este error de prediccion se debio a que los miembros de la muestra de Digest se habian tomado de las gufas de telefono y de otros li stados, como las listas de suscriptores a revistas y los registros de automoviles. En estas fuentes , estaban c1aramente subrepresentados los pobres, que eran predominantemente democratas. Para hacer una inferencia sobre una poblacion (en este caso, sobre el electorado estadounidense), es importante hacer una muestra de esa poblacion y no de algun subgrupo, por muy comodo que parezca esto ultimo.

2. Los sujetos de la encuesta pueden dar una respuesta inexacta 0 falsa. Eso podria ocurrir pOl'que las preguntas se formulan de una manera diffcil de en tender 0

de una forma que parece que una respuesta es mas agradable 0 mas deseable. Ademas, muchas preguntas que uno querria hacer son tan delicadas que seria imprudente esperar que todas las respuestas fueran sinceras. Supongamos, por ejemplo, que un jefe de planta quiere evaluar las perdidas anuales de la empresa que se deben a robos de los empleados. En principio, se podrfa seleccionar una muestra aleatoria de empleados y preguntar a sus miembros «(,que ha robado en esta planta en los 12 ultimos meses?». jEsta no es, desde luego, la forma mas fiable de conseguir la informacion necesaria!

3. Falta de respuesta a las preguntas de la encuesta. Los sujetos de una encuesta pueden no responder a ninguna pregunta 0 pueden no responder a algunas. Si ocurre en muchos casos, puede haber mas errores de muestreo 0 errores ajenos al muestreo. EI error de muestreo se debe a que el tamafio de la muestra logrado sera menor que el pretendido. El error ajeno al muestreo puede deberse a que la poblacion de la muestra no es la poblacion que interesa. Los resultados obtenidos pueden considerarse una muestra aleatoria de la poblaci6n que esta dispuesta a responder. Estas personas pueden ser diferentes en importantes aspectos de la poblacion en general. En ese caso, habra un sesgo en las estimaciones resultantes.

No existe ningun metodo general para idenlificar y analizar los errores ajenos al muestreo, pero estos pueden ser importantes. El investigador debe tener cuidado en cuestiones como la identificacion de Ia poblacion relevante, el disefio del cuestionario y la falta de respuesta para reducir 10 mas posible su importancia. En el resto de este capitulo, suponemos que se tiene ese cuidado, por 10 que en nuestro an:iIisis centramos la atencion en el tratamiento de los errores de muestreo.

EJERCICIOS

Ejercicios basicos

20.6. Vuelva al estudio del ejercicio 20.2.

a) Dentro del sistema de muestreo que ha disenado, i, ve la posibilidad de que haya errores ajenos al muestreo? En caso afirmativo, i,que medidas tomarfa para reducir 10 mas posible su magnitud?

b) i,Es probable que la falta de respuesta sea una cuestion grave en este estudio? En caso afirmativo, i,que podria hacerse para resolverla?

20.7. Vuelva al estudio del ejercicio 20.3.

a) Analice las causas probables de los errores ajenos al muestreo e indique como podrfan reducirse 10 mas posiblc.

b) i,Es de esperar que la falta de respuesta sea un problema grave para realizar este estudio? En caso afirmativo, i,como podrfa paliarse el problema?

20.8. En el caso del estudio del ejercicio 20.5, analice la posibilidad de que haya en'ores ajenos al

Page 9: Otros temas relacionados con el muestreo - Bibliotecabiblio3.url.edu.gt/Libros/2012/esta-AE/20.pdf · Muestreo bietapico Metodos de muestreo no probabilisticos Introducci6n Una gran

Capitulo 20. Otros temas relacionados con el muestreo 819

muestreo Y falta de respuesta. Indique que harfa para reducir 10 mas posible estos problemas.

llamar el jueves siguiente a los hogares en los que no hay nadie en casa. Este proceso puede continuar hasta que se logra hablar el jueves siguiente con los hogares con los que no se pudo hablar los dos jueves anteriores. (,Cuat podrfa ser el valor de la informacion obtenida de esta forma?

20.9. Un metodo para hacer frente a un tipo de falta de respuesta es el metoda del recuerdo. Se realiza una encuesta a los hogares en la que los entrevistadores Uaman el jueves por la tarde. Se vuelve a

20.3. Muestreo aleatorio simple . _ ..

En el resto de este capitulo, analizamos problemas en los que se extrae una muestra de n individuos u objetos de una poblaci6n que conticne un total de N miembros. En las aplicaciones pnicticas, se han utilizado muchos sistemas para seleccionar esas muestras. Nuestros amllisis centranin en gran parte la atenci6n en los metodos de muestreo probabiUstico, que son metodos en los que se utiliza algun mecanismo en el que interviene el azar para decidir los miembros de la muestra y se sabe cmU es la probabilidad de obtener una determinada muestra. Hacemos de nuevo hincapie en el concepto de muestreo aleatorio simple y en la forma en que se toma una muestra aleatoria simple de una poblaci6n finita, debido a su importancia.

Muestreo aleatorio simple Supongamos que tenemos que seleccionar una muestra de n objetos de una poblaci6n de N objetos. Un metoda de muestreo aleatorio simple es aquel en el que todos los miembros de una poblaci6n tienen la misma probabilidad de ser elegidos para la muestra.

Supongamos que nuestra poblaci6n esta formada por 1.000 individuos, numerados del 1 al 1.000 y que se necesita una muestra aleatoria simple de 100 miembros de la poblaci6n. El programa Minitab puede generar facilmente una muestra aleatoria simple. Por ejemplo, una lista parcial de los 100 numeros aleatorios que generamos con Minitab incluye las personas que tienen los numeros

457 229 843 460 918 311

S610 consideraremos el muestreo sin repeticion, en el que se excluye cualquier numero que ya ha salido y el proceso continua hasta que se obtienen 100 numeros diferentes. No analizamos aqu! la alternativa, el muestreo con repeticion, que permite incluir un individuo en la muestra mas de una vez.

El muestreo sistematico es un metodo de muestreo estadistico que se utiliza a menudo como alternativa al muestreo aleatorio.

Muestreo sistematico Supongamos que la lista de la poblaci6n se ordena de una forma que no tiene ninguna relaci6n con el tema de interes. EI muestreo sistematico implica la selecci6n de todo j-esimo sujeto de la poblaci6n, don de j es el cociente entre el tamaiio de la poblaci6n Ny el tamaiio que se desea que tenga la muestra, n; es decir, j = Nln. Se selecciona aleatoriamente un numero del 1 al j para obtener el primer sujeto que va a incluirse en la muestra sistematica.

Page 10: Otros temas relacionados con el muestreo - Bibliotecabiblio3.url.edu.gt/Libros/2012/esta-AE/20.pdf · Muestreo bietapico Metodos de muestreo no probabilisticos Introducci6n Una gran

820 Estadistica para administraci6n y economia

Supongamos que se desea que el tamano de la muestra sea de 100 y que la poblaci6n esta formada por 5.000 nombres en orden alfabetico. En ese caso, j = 50. Seleccionamos aleatoriamente un numero del 1 alSO. Si el numero es el 20, seleccionamos ese numero y los sucesivos numeros obtenidos sumando 50 al numero inicial; de esa manera, se obtiene una muestra sistematica formada por los elementos que Ilevan los numeros 20, 70, 120, 170, etc. hasta que se seleccionan los 100 sujetos. Una muestra sistematica se analiza de la misma forma que una muestra aleatoria simple, ya que, en relaci6n con el tema investigado, la lista de la poblacion ya esta en orden aleatorio. El peligro esta en que exista alguna relaci6n sutil e inesperada entre el orden de la poblaci6n y el tema estudiado. En ese caso, habrfa un sesgo si se empleara un muestreo sistematico. Las muestras sistematicas constituyen una buena representaci6n de la poblaci6n si la poblaci6n no experimenta ninguna variaci6n ciclica.

Analisis de los resultados de un muestreo aleatorio simple

En este apartado se amplfan las estimaciones del intervalo de confianza desarrolladas en el Capitulo 8. Sin embargo, aqui se analizan los casos en los que el numero de miembros de la muestra no es una proporci6n insignificante del numero de miembros de la poblaci6n. Por 10 tanto, se utiliza el factor de correccion en el caso de una pohlacion finita, eN - n)/N. Se supondra que la muestra es 10 suficientemente grande para poder recurrir al teorema del limite central.

Estimacion de la media poblacional, muestra aleatoria simple Sean x" x2 ' . . . , Xn los valores observados en una muestra aleatoria simple de tamaiio n, tomada de una poblacion de N miembros que tiene una media /.1.

1. La media muestral es un estimador insesgado de la media poblacional, fl. La estimacion puntual es

1 II

.x = - L Xi n i=\

2. Un metoda de estimacion insesgada de la varianza de la media muestral genera la estimacion puntual

S2 N - m il~ = - x ---

x n N (20.1)

3. Siempre que el tamaiio de la muestra es grande, los intervalos de confianza al 100(1 - a)% de la media poblacional son

(20.2)

EJEMPLO 20.1. Creditos hipotecarios (intervalo de confianza)

En una ciudad, se solicitaron 1.118 creditos hipotecarios el ano pasado. Una muestra aleatoria de 60 de estos creditos era de una cuantia media de 87.300 $ y tenia una desviaci6n tfpica de 19.200 $. Estime la cantidad media de todos los creditos hipotecarios solicitados en esta ciudad el ano pasado y halle el intervalo de confianza al 95 por ciento.

Page 11: Otros temas relacionados con el muestreo - Bibliotecabiblio3.url.edu.gt/Libros/2012/esta-AE/20.pdf · Muestreo bietapico Metodos de muestreo no probabilisticos Introducci6n Una gran

Capitulo 20. Otros temas relacionados con 81 muestreo 821

Solucion

Sea II la media pobl ac ional. Se sabe que

N=1.118 n = 60 x = 87.300 $ s = 19.200

Para obtener estimaciones de intervalos, utilizamos la ecuaci6n 20.1:

r? = i x (N - 11) x n N

(19.200)2 1.058 --- x - - = 5.814.268

60 1.118

y tomamos la ralz cuadrada para hallar el error tlpico estimado,

6.>: = 2.411

Por 1o tanto, el intervalo de confianza al 95 por ciento de la cantidad media de todas las hipotecas solicitadas en esta ciudad el ano pasado es

87.300 $ - (1,96)(2.411) < II < 87.300 $ + (1,96)(2.411)

o sea

82.574 $ < II < 92.026 $

Es decir, el intervalo va de 82.574 $ a 92.026 $.

A menudo, 10 que interesa es el total poblacional en lugar de Ia media. Por ejemplo, el editor de un libro de texto de estadistica para los negocios querra una estimaci6n del numero total de estudiantes que asisten a los cursos de estadlstica para los negocios en to do el pals. Es facil hacer una inferencia sobre el total poblacional. Los resultados relevantes se deducen del hecho de que en nuestra notaci6n, el total poblacional = Nfl.

Estimacion del total poblacional, muestra aleatoria simple

Supongamos que se selecciona una muestra aleatoria simple de tamafio n de una poblaci6n de tamafio Ny que la cantidad que se quiere estimar es el total poblacional N,l.

1. Un metodo de estimaci6n insesgada del total poblacional Nil genera la estimaci6n puntual Nx.

2. Un metodo de estimaci6n insesgada de la varianza de nuestro estimador del total poblacional genera la estimaci6n puntual:

(20.3)

3. Siempre que el tamafio de la muestra es grande, se obtiene un intervalo de confianza al 100(1 - a)% del total poblacional de la forma siguiente:

(20.4)

Page 12: Otros temas relacionados con el muestreo - Bibliotecabiblio3.url.edu.gt/Libros/2012/esta-AE/20.pdf · Muestreo bietapico Metodos de muestreo no probabilisticos Introducci6n Una gran

822 Estadfstica para administraci6n y economfa

EJEMPLO 20.2. Numero de matriculados en los cursos de estadistica para los negocios (intervalo de confianza)

Supongamos que hay 1.395 universidades en un pais. En una muestra aleatoria simple de 400 universidades, se observa que la media muestral del numero de matriculados el ano pasado en los cursos de estadfstica para los negocios era de 320,8 estudiantes y que la desviacion tfpica muestral era de 149,7 estudiantes. Estime el numero total de estudiantes matriculados en estos cursos durante el ano y halle el intervalo de confianza al 99 por ciento.

Soluci6n

Si la media poblacional es J-L, para estimar NJ-L se utilizan los datos siguientes:

N = 1.395 n = 400 x = 320,8 s = 149,7

Nuestra estimacion puntual del total es

Nx = (1.395)(320,8) = 447.516

Se estima que hay un total de 447.516 alumnos matriculados en los cursos. Para obtener estimaciones de intervalos, se utiliza la ecuacion 20.3 para calcular la varianza del estimador:

S2 (1497i N2o- 2

,c = - N(N - n) = ' (1.395)(995) = 77.764,413 , n 400

Tomando la rafz cuadrada, tenemos que

NCrx = 8.818,4

Por 10 tanto, el intervalo de confianza al 99 por ciento del total poblacional se obtiene aplicando la ecuacion 20.4, siendo Za/2 = 2,58:

o sea

447.516 - (2,58)(8.818,4) < Nfl < 447.516 + (2,58)(8.818,4)

447.516 ± 22.751

424.765 < Nfl < 470.267

Por 10 tanto, nuestro intervalo va de 424.765 a 470.267 estudiantes.

Consideremos, por ultimo, el caso en el que hay que estimar la proporci6n p de individuos de la poblacion que poseen una caracterfstica especffica. La inferencia sobre esta propOl'cion debe basarse en la distribucion hipergeometrica cuando el numero de miembros de la muestra no es muy pequeno en comparacion con el numero de miembros de la poblacion. Supongamos, de nuevo, que el tamano de la muestra es 10 suficientemente grande para poder invocar el teorema del Ifrnite central.

Page 13: Otros temas relacionados con el muestreo - Bibliotecabiblio3.url.edu.gt/Libros/2012/esta-AE/20.pdf · Muestreo bietapico Metodos de muestreo no probabilisticos Introducci6n Una gran

Capitulo 20. Otros temas relacionados con el muestreo 823

Estimacion de la proporcion poblacional, muestra aleatoria simple Sea p la proporcion que posee una determinada caracterfstica en una muestra aleatoria de n observaciones de una poblacion que tiene una proporcion, P, que posee esa caracterfstica.

1. La proporcion muestral, p, es un estimador insesgado de la proporcion poblacional, P. 2. Un metoda de estimacion insesgada de la varianza de nuestro estimador de la propor

cion poblacional genera la estimacion puntual

~2 pO - F5) (N - n) (J - = X ---

P n - 1 N (20.5)

3. Siempre que el tamano de la muestra es grande, los intervalos de confianza del 100(1 - a)% de la proporcion poblacional son

(20.6)

EJEMPLO 20.3. Cursos anuales de estadfstica para los negocios (intervalo de confianza)

Se ha observado en una muestra aleatoria simple de 400 universidades de las 1.395 que hay en nuestra poblaci6n que el curso de estadfstica para los negocios era un curso anual en 141 de las universidades de la muestra. Estime la proporci6n de todas las universidades en la que el curso es anual y halle el intervale de confianza al 90 por ciento.

Solucion

Dados

N = 1.395 n = 400 ~ 141 P = - = 03525

400 '

nuestra estimaci6n puntual de la proporci6n poblacional, P, es simplemente p = 0,3525. Es decir, el curso es anual en alrededor del 35,25 por ciento de todas las universidades. Para calcular estimaciones de intervalos, la varianza de nuestra estimaci6n se halla mediante la ecuaci6n 20.5:

_? pO - p) (N - n) (0,3525)(0,6475) 995 (J"" = x = x -- = 0,0004080

P n - 1 N 399 1.395

por 10 que ai; = 0,0202

En el caso de un intervalo de confianza al 90 por ciento, Za/2 = Zo.os = 1,645. EI interva-10 de confianza al 90 por ciento se halla por medio de la .ecuaci6n 20.6:

p - Zrt/2a p < P < p + Zal2ap o sea

0,3525 - (1,645)(0,0202) < P < 0,3525 + (1,645)(0,0202) o sea

0,3193 < P < 0,3857

Por 10 tanto, el intervalo de confianza al 90 por ciento del porcentaje de todas las universidades en las que el curso de estadfstica para los negocios es anual va del 31,93 al 38,57 por ciento.

Page 14: Otros temas relacionados con el muestreo - Bibliotecabiblio3.url.edu.gt/Libros/2012/esta-AE/20.pdf · Muestreo bietapico Metodos de muestreo no probabilisticos Introducci6n Una gran

824 Estadfstica para administracion y economfa

EJERCICIOS

Ejercicios aplicados

20.10. Consulte un periodico economico para obtener un listado de todas las acciones que cotizan en bolsa. Utilice el programa Minitab para obtener una muestra aleatoria simple de 20 acciones. Halle la subida porcentual media que experimento el precio de las acciones de esta muestra la semana pasada.

20.11. Obtenga en su periodico local un listado de todos los anuncios de viviendas en venta en su ciudad. Utilice el programa Minitab para obtener una muestra aleatoria simple de 15 anuncios y halle la media muestral de los precios anunciados.

20.12. Un campus tiene 12.723 estudiantes. Quiere una muestra aleatoria de 100 de un listado completo de estos estudiantes. Explique como utili zaria el programa Minitab para obtener esa muestra aleatoria.

20.13. Tome una muestra aleatoria de 50 pagll1as de este libro y estime la proporcion de todas las paginas que contienen cifras.

20.14. Una empresa tiene 189 contables. En una muestra aleatoria de 50 de elIos, el numero medio de horas extraordinarias trabajadas en una semana fue de 9,7 y la desviacion tfpica muestral fue de 6,2 horas. Halle el intervalo de confianza al 95 pOl' ciento del numero medio de horas extraordinarias trabajadas pOl' cad a contable en esta empresa esa semana.

20.15. Un auditor, examinando un total de 820 facturas pendientes de cobro de una empresa, tomo una muestra aleatoria de 60. La media muestral era de 127,43 $ y la desviacion tfpica muestral

. era de 43 ,27 $.

a) Halle una estimacion de la media poblacional utilizando un metodo de estimacion insesgada.

b) Halle una estimacion de la varianza de la media muestral utilizando un n:etodo de estimacion insesgada.

c) Halle el intervalo de confianza al 90 por ciento de la media poblacional.

d) Un estadistico obtuvo un intervalo de confianza de la media poblacional que iba de 117,43 $ a 137,43 $. (,Cual es el contenido probabilfstico de este intervalo?

20.16. Un dfa una organizacion de consumidores recibio 125 llamadas. Se observ6 que en una muestra aleatoria de 40 llamadas, el tiempo medio dedicado a dar la informaci6n solicitada era de 7,28 minutos y la desviaci6n tipica muestral era de 5,32 minutos. Halle el intervalo de confianza al 99 pOl' ciento del tiempo medio pOl' llamada.

20.17. Indique si es verdadera 0 falsa cada una de las afirmaciones siguientes:

a) Dado un numero de miembros de una poblacion y dada una varianza muestral, cuanto mayor es el numero de miembros de la muestra, mayor es el intervalo de confianza al 95 pOI' ciento de la media poblacional.

b) Dado un numero de miembros de una poblaci6n y dado un numero de miembros de la muestra, cuanto mayor es la varianza muestral, mayor es el intervalo de confianza al 95 pOl' ciento de la media poblacional.

c) Dado un numero de miembros de una muestra y dada una varianza muestral , cuanto mayor es el numero de miembros de la poblaci6n, mayor es el intervalo de confianza al 95 por ciento de la media poblacional.

d) Dado un numero de miembros de una poblaci6n, dado un numero de miembros de la muestra y dada una varianza muestral , un intervalo de confianza al 95 pOl' ciento de la media poblacional es mayor que un interva-10 de confianza al 90 por ciento de la media poblacional.

20.18. Demuestre que nuestra estimaci6n de la varianza de la media muestral puede expresarse de la forma siguiente:

;;~ = S2 (~ - ~) n N

20.19. Basandose en los datos del ejercicio 20.14, halie el intervale de confianza al 99 pOl' ciento del numero total de horas extraordinarias trabajadas pOI' los contables en la empresa durante la semana de interes.

20.20. Basandose en los datos del ejercicio 20.15, halIe el intervalo de confianza al 95 pOl' ciento de la cuantia total de estas 820 facturas pendientes de cobro.

20.21. Basandose en los datos del ejercicio 20.16, halie el intervalo de confianza al 90 pOI' ciento de la cantidad total de tiempo dedicado a responder a estas 125 llamadas.

Page 15: Otros temas relacionados con el muestreo - Bibliotecabiblio3.url.edu.gt/Libros/2012/esta-AE/20.pdf · Muestreo bietapico Metodos de muestreo no probabilisticos Introducci6n Una gran

Capitulo 20. Otros temas relacionados con el muestreo 825

0.22. Un alto directivo, responsable de un grupo de 120 ejecutivos, estli interesado en saber cWlnto tiempo dedican en total cad a seman a estas personas a reuniones internas. Se pide a una muestra aleatoria de 35 ejecutivos que anoten diariamente sus actividades la proxima semana. Cuando se analizan los resultados, se observa que estos miembros de esta muestra dedican un total de 143 horas a reuniones internas. La desviacion tfpica muestral es de 3,1 horas. Halle el intervalo de confianza al 90 por ciento del numero total de horas dedicadas a reuniones internas por los 120 ejecutivos durante la semana.

W.23. Una muestra aleatoria simple de 400 universidades de un total de l.395 contenfa 39 que utilizaban el libro de texto Estadistiea difiei! y aburrida. Halle el intervale de confianza al 95 por ciento de la proporcion de universidades que utilizaban este libro .

W.24. EI decano de una escuela de administracion de empresas estli considerando la posibilidad de proponer un cambio de los requisitos para obtener el titulo . Actualmente, los estudiantes tienen que cursar una asignatura de ciencias elegida de

20.4. Muestreo estratificado

una li sta de asignaturas posibles. La propuesta es que se sustituya por una asignatura de ecologfa. La escuela tiene 420 estudiantes. En una muestra aleatoria de 100 estudiantes, 56 han declarado que son contrarios a esta propuesta. HaIle el intervalo de confianza al 90 por ciento de la proporcion de todos los estudiantes que se oponen al cambio de los requisitos.

20.25. En una residencia universitaria, 257 de los residentes son estudiantes de primer ano. En una muestra aleatoria de 120 de ellos, 37 declat'an que tienen mucho interes en vivir en la residencia el proximo ano. Halle el intervalo de confianza al 95 por ciento de la proporcion de estudiantes de primer ano de esta residencia que tienen mucho interes en vivir en ella el proximo ano.

20.26. Una clase tiene 420 estudiantes. El examen final es optativo: si se hace, la nota puede subir, pero nunca bajar. En una muestra aleatoria de 80 estudiantes, 31 declararon que harfan el ex amen final. Halle el intervalo de confianza al 90 por ciento del numero total de estudiantes de esta clase que tienen intencion de hacer el examen final.

Supongamos que decidimos investigar las opiniones de los estudiantes de nuestro campus universitario sobre algun tema delicado y que puede ser diffcil formular las preguntas. Es probable que queramos hacer varias preguntas a cada miembro de la muestra y, dada la limitaci6n de recursos, s610 es posible tomar una muestra bastante pequefia. Probablemente elegirfamos una muestra aleatoria simple, por ejemplo, de 100 estudiantes de una !ista de todos los estudiantes del campus. Supongamos, sin embargo, que tras examinar mas detenidamente los expedientes de los miembros de la muestra, observamos que s610 dos estudian administraci6n de empresas, aunque la proporci6n poblacional de estudiantes de administraci6n de empresas es mucho mayor. Nuestro problema en esta fase es doble. En primer lugar, podemos muy bien tener interes en comparar las opiniones de los estudiantes de administraci6n de em pres as con las del resto de la poblaci6n de estudiantes. Eso es diffcilmente viable, dada su mfnima representaci6n en nuestra muestra. En segundo lugar, podemos sospechar que las opiniones de los estudiantes de administraci6n de empresas sobre esta cuesti6n seran diferentes de las de sus compafieros. Si fuera asf, nos preocupara la fiabilidad de la inferencia basada en una muestra en la que este grupo esta seriamente subrepresentado.

Tal vez podrfamos consolarnos pensando que, como hemos tornado una muestra aJeato ria, cualquier estimador obtenido de la forma habitual sera insesgado, por 10 que Ja inferencia resultante, en el senti do estadfstico, sera estrictamente valida. Sin embargo, basta una breve reflexi6n para convencernos de que apenas sirve de consuelo. Lo que significa que el estimador es insesgado es que si se repite el metodo de muestreo muchas veces y se

Page 16: Otros temas relacionados con el muestreo - Bibliotecabiblio3.url.edu.gt/Libros/2012/esta-AE/20.pdf · Muestreo bietapico Metodos de muestreo no probabilisticos Introducci6n Una gran

826 Estadfstica para administraci6n y economfa

calcula el estimador, su media sera igual al valor poblacional correspondiente. Pero en realidad no vamos a repetir el metodo de muestreo muchas veces. Tenemos que basar nuestras conclusiones en una unica muestra, y el hecho de que los estudiantes de administracion de empresas pudieran haber estado sobrerrepresentados en otras muestras que hubieramos podido tomar, 10 que a largo plazo habrla compensado, no es muy uti!.

Existe una segunda y tentadora posibilidad que es preferible en muchos sentidos a la de utilizar la muestra original. Podrlamos descartar simplemente la muestra original y tomar otra. Si la constitucion de la muestra lograda en el segundo intento parece mas representativa de la poblacion en general, puede muy bien que sea mejor trabajar con ella. Ahora la dificultad estriba en que el metodo de muestreo que hemos adoptado -se muestrea la poblacion hasta que se logra una muestra que nos gusta- es muy diflcil de formalizar, por 10 que los resultados de la muestra son muy difkiles de analizar con algllna validez estadfstica. Ya no es un muestreo aleatorio simple, par 10 que los metodos del apartado 20.3 no son estrictamente validos.

Afortunadamente, existe un tercer sistema de muestreo para no tener este tipo de problema. Si se sospecha al principio que algllnas caracteristicas identificables de los miembros de la poblacion estan relacionadas con el tema de investigacion 0 si algunos subgrupos de la poblacion tienen un interes especial para el investigador, no es necesario (y probablemente no es deseable) conformarse con el muestreo aleatorio simple para seleccionar a los miembros de la muestra. En lugar de eso, se puede dividir la poblacion en sllbgrupos 0 estratos y tomar una muestra aleatoria simple de cada estrato. EI unico requisito es que sea posible identificar que cada miembro de la poblacion pertenece a un estrato y solo a uno.

Muestreo aleatorio estratificado Supongamos que una poblacion de N individuos puede subdividirse en K grupos mutuamente excluyentes y colectivamente exhaustivos 0 estratos. Un muestreo aleatorio estratificado es la seleccion de muestras aleatorias simples independientes de cad a estrato de la poblacion. Si los K estratos de la poblaci6n contienen N" N2 , . .. , NK miembros, entonces

No es necesario tomar el mismo numero de miembros de la muestra de cada estrato. Sea el numero de la muestra n" n2 , ... , nf(" En ese caso, el numero total de miembros de la muestra es

La poblacion de estudiantes cuyas ideas se quieren conocer podrfa dividirse en dos estratos: estudiantes de administracion de empresas y resto. Tambien es posible hacer una estratificacion menos sencilla. Supongamos que, en algun otro tema, creemos que el sexo y el curso del estudiante (cuarto curso, tercer curso, segundo curso 0 primer curso) pueden ser relevantes. En ese caso, para satisfacer el requisito de que los estratos sean mutllamente excluyentes y colectivamente exhaustivos, se necesitan ocho estratos: mujeres de cuarto curso, hombres de cuarto curso, etc.

Mas adelante en este apartado, nos preguntamos como se reparte el esfuerzo de muestreo entre los estratos. Una atractiva posibiIidad, empleada a menudo en la practica, es la asignaci6n proporcional: la proporcion de miembros de la muestra perteneciente a cualquier estrato es igual que la proparcion de miembros de la poblacion perteneciente a ese estrato.

Page 17: Otros temas relacionados con el muestreo - Bibliotecabiblio3.url.edu.gt/Libros/2012/esta-AE/20.pdf · Muestreo bietapico Metodos de muestreo no probabilisticos Introducci6n Una gran

Capftu lo 20. Otros temas relacionados can el muestreo 827

Amilisis de los resultados de un muestreo aleatorio estratificado

EI amilisis de los resultados de una muestra aleatoria estratificada es relativamente sencilIo. Sean 11 1' {i2' ... , {iK las medias poblacionales de los K estratos Y X I' X2' ... , xK las medias muestrales correspondientes. Consideremos un estrato, por ejemplo, el i-esimo estrato. Dado que se ha tornado una muestra aleatoria simple en este estrato, la media muestral del estrato es un estimador insesgado de la media poblacional {ij' Utilizando un metodo de estimaci6n insesgada de la varianza de la media muestral del estrato, la estimaci6n puntual es

donde sJ es la varianza muestral del j-esimo estrato. Es posible, pues, hacer una inferencia sobre los estratos individuales de la misma forma que en el apartado 20.3.

Generalmente, tienen interes las inferencias sobre la media poblacional {i del conjunto de la poblaci6n, que es

Una estimaci6n puntual natural es

Un estimador insesgado de la varianza del estimador de {i se deduce del hecho de que las muestras de cada estrato son independientes entre sf Y la estimaci6n puntual es

~? 1 IK2~2 (J " = - N·(J -

x" N2 J Xj j = 1

Las inferencias sobre la media del conjunto de la poblaci6n pueden basarse en estos resultados.

Estimacion de la media poblacional, muestra aleatoria estratificada Supongamos que se toman muestras aleatorias de n. individuos de estratos que contienen N. individuos (j = 1, 2, ... , K) . Sea J J

Y I nj = n j = 1

Sean las medias y las varianzas muestrales de los estratos X. y i': (j = 1, 2, ... , K) Y la media del conjunto de la poblacion /1. J J

1. Un metodo de estimacion insesgada de la media del conjunto de la poblacion p genera la estimacion puntual

(20.7)

Page 18: Otros temas relacionados con el muestreo - Bibliotecabiblio3.url.edu.gt/Libros/2012/esta-AE/20.pdf · Muestreo bietapico Metodos de muestreo no probabilisticos Introducci6n Una gran

828 Estadfstica para administracion y economfa

2. Un metoda de estimaci6n insesgada de la varianza de nuestro estimador de la media del conjunto de la poblaci6n genera la estimaci6n puntual

~ 2 1 IK 2 ~2 (J e = - N· (J e

.1.,1 N2 J .I j )= I

(20.8)

donde

~2 _ sJ (N) - n) (J - - - x ----=-----"---

Xj N n) )

(20.9)

3. Siempre que el tamafio de la muestra es grande, se obtienen intervalos de confianza al 100(1 - 0:)% de la media poblacional de muestras aleatorias estratificadas de la forma siguiente:

(20.10)

EJEMPLO 20.4. Cadena de restaurantes (estimacion)

Una cadena de restaurantes tiene 60 en Illinois, 50 en Indiana y 45 en Ohio. La direccion esta considerando la posibilidad de afiadir un nuevo plato a su menu. Para averiguar cual es la demanda probable de este plato, se introduce en el menu de muestras aleatorias de 20 restaurantes de Illinois, 10 de Indiana y 9 de Ohio. Utilizando los subindices 1, 2 Y 3 para representar Illinois, Indiana y Ohio, respectivamente, las medias y las desviaciones tfpicas muestrales del numero de pedidos de este plato por restaurante en los tres estados en una semana es

,t l = 21,2

X2 = 13,3

X3 = 26,1

Sl = 12,8

S2 = 11,4

S3 = 9,2

Estime el numero medio de pedidos semanaies por restaurante, {l, en todos los restaurantes de esta cadena.

Solucion

Se sabe que

N = 155

n = 31

Nucstra estimacion de la media poblacional es

__ 1 ~ __ (60)(21,2) + (50)(13,3) + (45)(26,1) _ Xst - N )~l N)x) - 155 - 20,1

Por 10 tanto, el numero medio estimado de pedidos semanales pOl' restaurante es 20,1.

Page 19: Otros temas relacionados con el muestreo - Bibliotecabiblio3.url.edu.gt/Libros/2012/esta-AE/20.pdf · Muestreo bietapico Metodos de muestreo no probabilisticos Introducci6n Una gran

Capitulo 20. Otros temas relacionados con el muestreo 829

EI paso siguiente es calcular las cantidades

(12,8)2 48 12 x 60 = 10,923

Estas cantidades, junto con las medias muestrales de cada estrato, pueden utilizarse para calcular intervalos de confianza de las medias poblacionales de los tres estratos, exactamente como en el ejemplo 20.1 (aunque en este caso el tamafio de la muestra es demasiado pequeno por comodidad). Centramos la atenci6n en la media del conjunto de la poblaci6n. Para obtener intervalos de confianza para esta cantidad,

K ~ 7 1 I ? ~2 (J'O = - N":(Jc

~\.';'l N2 j -\ j )=1

(60)2(10,923) + (50)2(10,397) + (45)2(7,524) = (155)2 = 3,353

y, tom an do la rafz cuadrada,

a- = 1 83 Xst '

POI' 10 tanto, el intervalo de confianza al 95 pOl' ciento del numero medio de pedidos por restaurante realizados en una semana es

20,1 - (1,96)(1,83) < II < 20,1 + (1,96)(1 ,83)

o sea

16,5 < /1 < 23,7

El intervalo de confianza al 95 pOl' ciento va de 16,5 a 23,7 pedidos pOl' restaurante.

Dado que el total poblacional es el pro due to de la media poblacional y el numero de miembros de la poblaci6n, estos metodos pueden modificarse facilmente para poder estimarlo.

Estimacion del total poblacional, muestra aleatoria estratificada Supongamos que se toman muestras aleatorias de n individuos de estratos que contienen N individuos (j = 1, 2, .. . , K) Y que la cantidad que quie~e estimarse es el total poblacional, N{l. J

1. Un metodo de estimaci6n insesgada de Nfl genera la estimaci6n puntual

NXsI = I Ni; (20.11) j=1

2. Un metodo de estimaci6n insesgada de la varianza de nuestro estimador del total poblacional genera la estimaci6n

(20.12)

3. Siempre que el tamaiio de la muestra es grande, se obtienen intervalos de confianza al 100(1 - IX)% del total poblacional de muestras aleatorias estratificadas de la forma siguiente:

(20.13)

EJEMPLO 20.5. Nlimero anual total de matriculados en estadlstica para los negocios (estimaci6n)

De las 1.395 universidades que hay en un pais, 364 son escuelas universitarias, en las que la duraci6n de los estudios es de 2 afios, y 1.031 son facultades, en las que la duraci6n de los estudios es de 4 afios. Se toma una muestra aleatoria de 40 escuelas universitarias y una muestra aleatoria simple independiente de 60 facultades. La tabla adjunta muestra las medias muestrales y las desviaciones tfpicas muestrales del numero de estudiantes matriculados el ano pasado en la asignatura de estadfstica para los negocios. Estime el numero total anual de matriculados en esa asignatura.

Media Desviacion tipica

Solucion

Se sabe que

Escuelas universitarias

N] = 364 nj = 40

N2 = 1.031 n2 = 60

154,3 87,3

XI = 154,3

X2 = 411,8

Nuestra estimaci6n del total poblacional es

Facultades

411,8 219,9

Sj = 87,3

S2 = 219,9

NXsI = I Njx) = (364)(154,3) + (1.031)(411,8) = 480.731 )=1

A continuaci6n,

Por ultimo,

N2(jt = I N](jt = (364)\169,59) + (1.031)2(759,03) = 820.289.284 i=1

Page 21: Otros temas relacionados con el muestreo - Bibliotecabiblio3.url.edu.gt/Libros/2012/esta-AE/20.pdf · Muestreo bietapico Metodos de muestreo no probabilisticos Introducci6n Una gran

Capitulo 20. Otros temas relacionados con el muestreo 831

y, tomando la ralz cuadrada, ~2

N(J", = 28.797

En el caso del intervalo de confianza al 95 por ciento,

Z::t./2 = Z0.025 = 1,96

EI intervalo al 95 por ciento que buscamos es, pues,

480.731 - (1,96)(28.797) < Nil < 480.731 + (1,96)(28.797)

o sea

424.289 < NIL < 537.173

Por 10 tanto, nuestro intervalo de confianza al 95 por ciento va de 424.289 a 537.173 estudiantes matriculados.

Consideremos ahora el problema de estimar una proporci6n poblacional basandonos en una muestra aleatoria estratificada. Sean Pl , P2 , ... , P K las proporciones poblacionales de los K estratos Y Pl' P2, ... , PK las proporciones muestrales correspondientes. Si P representa la proporci6n de la poblaci6n total, su estimaci6n se bas a en el hecho de que

P = NlP l + N2P2 + ... + NKPK = ~ I NP N N j~l J J

A continuaci6n, se muestran los metodos para estimar la proporci6n poblacional a partir de una muestra aleatoria estratificada.

Estimacion de la proporcion poblacional, muestra aleatoria estratificada Supongamos que se toman muestras aleatorias de n. individuos de estratos que contienen N. individuos (j = 1, 2, .. . , K) . Sea P la proporci6n pob(acional y p la proporci6n muestral en e( j-esimo estrato de los que poseen

i una determinada caracterfstic~. Si P es la proporci6n de la

poblaci6n total:

1. Un metoda de estimaci6n insesgada de P genera

(20.14)

2. Un metodo de estimaci6n insesgada de la varianza de nuestro estimador de la proporci6n de la poblaci6n total es

~2 1 LK 2 ~2 (J - = - N (J-Ps/ N 2 j= I J Pj

(20.15)

donde

~2 pi! - p) (Nj - n) (J - = x ----"--"--

Pj n-1 N J J

(20.16)

es la estimaci6n de la varianza de la proporci6n muestral del j-esimo estrato.

Page 22: Otros temas relacionados con el muestreo - Bibliotecabiblio3.url.edu.gt/Libros/2012/esta-AE/20.pdf · Muestreo bietapico Metodos de muestreo no probabilisticos Introducci6n Una gran

832 Estadfstica para administracion y economfa

3. Siempre que el tamano de la muestra es grande, se obtienen intervalos de confianza al 100(1 - a)% de la proporci6n poblacional de muestras aleatorias estratificadas de la forma siguiente:

(20.17)

EJEMPLO 20.6. Estadistica impartida en los departamentos de economia (estimacion)

Supongamos que en el estudio del ejemplo 20.5 observamos que la asignatura de estadfstica para los negocios se imparte en el departamento de economfa de 7 escuelas universitarias y de 13 facultades de la muestra. Estime la proporcion de todas las universidades en las que se imparte esta asignatura en el departamento de economfa.

Solucion

Se sabe que

~ 7 /7 =-=0175

I 40 '

~ 13 P2 = - = 0217

60 ' N2 = 1.031 n2 = 60

Nuestra estimacion de la proporcion poblacional es

~ = ~;, ~ = (364)(0,175) + (1.031)(0,217) = Pst N j~1 Njpj 1.395 0,206

Por 10 tanto, se estima que en el 20,6 por ciento de todas las escuelas universitarias el departamento de economfa imparte la asignatura.

A continuacion,

~2 PI(l - PI) (NI - nl) (0,175)(0,825) 324 (J- = x = x - = 0.003295

PI f11 - 1 N I 39 364·

~2 P2(l - P2) (N2 - n2) (0,217)(0,783) 971 (J- = x = x -- = 0002712

P2 n2 - 1 N2 59 1.031'

Estos valores, junto con las proporciones muestrales de cada estrato, pueden utilizarse para calcular interval os de confianza de las proporciones de la poblacion de los dos estratos, exactamente como en el ejemplo 20.3. Aqui centramos la atencion en la estimacion por interval os de la proporcion de la poblacion total, para la que

~~ = _1 IK 2~? = (364)2(0,003295) + (1.031)2(0,002712) = (Jp ~ NJ. (JI> 2 0,001706

S/ N- j= I J (1.395)

por 10 que, tomando Ia rafz cuadrada, tenemos que

6- = 00413 PoIt '

Page 23: Otros temas relacionados con el muestreo - Bibliotecabiblio3.url.edu.gt/Libros/2012/esta-AE/20.pdf · Muestreo bietapico Metodos de muestreo no probabilisticos Introducci6n Una gran

Capitulo 20. Otros temas relacionados con el muestreo 833

En el caso del intervale de confianza al 90 por ciento,

Za/2 = Zo.OS = 1,645

y el intervale de confianza al 90 por ciento de la proporcion poblacional de una muestra aleatoria estratificada es

(0,206) - (1,645)(0,0413) < P < (0,206) + (1,645)(0,0413)

0,138 < P < 0,274

Este intervale va del 13,8 al 27,4 por ciento de todas las universidades.

Afijacion del esfuerzo muestral a los distintos estratos Queda por analizar la cuestion del reparto del esfuerzo muestral entre los estratos. SUponiendo que se selecciona un total de n miembros, ~cU(intas de estas observaciones muestrales deben asignarse a cada estrato? En realidad, el estudio en cuestion puede tener muchos objetivos, 10 cual significa que no existe una clara respuesta. No obstante, es posible especificar unos criterios de eleccion que el investigador debe tener presentes. Si se sabe poco o nada de antemano sobre la poblacion y si no hay ninglin requisito para la produccion de informacion acerca de estratos poco poblados, es logico elegir una afiJaci6n proporcional.

Afijacion proporcional: tamano de la muestra La proporci6n de miembros de la muestra que hay en un estrato es igual que la proporci6n de miembros de la poblaci6n que hay en ese estrato. Por 10 tanto, considerando el j-esimo estrato,

n· N ...l.=-....!.. n N

(20.18)

por 10 que el tamano de la muestra del j-esimo estrato utilizando la afijacion proporcional es

N n· = -....!.. x n

J N (20.19)

Este mecanismo de afijacion intuitivamente razonable se emplea frecuentemente y permite, por 10 general, realizar un analisis satisfactorio. Observese que en el ejemplo 20.4 utilizamos la afijacion proporcional. Dividimos un total de N = 155 restaurantes en tres estratos (Illinois, Indiana y Ohio). Seleccionamos una muestra de n = 31, siendo

60 n] = - x 31 = 12

155

50 n2 = - x 31 = 10

155

45 n3 = - x 31 = 9

155

A veces la utilizacion estricta de la afijacion proporcional produce relativamente pocas observaciones en los estratos que Ie interesan especialmente al investigador. En ese caso, la inferencia sobre los parametros poblacionales de estos estratos podrfa ser bastante imprecisa. En estas circunstancias, puede ser preferible afijar mas observaciones a esos estratos que las que dicta la afijacion proporcional. En los ejemplos 20.5 y 20.6, 364 de las

Page 24: Otros temas relacionados con el muestreo - Bibliotecabiblio3.url.edu.gt/Libros/2012/esta-AE/20.pdf · Muestreo bietapico Metodos de muestreo no probabilisticos Introducci6n Una gran

834 Estadfstica para administracion y economfa

1.395 universidades son escuelas universitarias y se toma una muestra de 100 observaciones. Si se hubiera utilizado la afijaci6n proporcional, el numero de escuelas incluidas en la muestra habria sido

N, 364 n = - x n = - - x 100 = 26 'N l.395

Dado que al editor Ie interesaba especial mente obtener informaci6n sobre este mercado, se pens6 que no seria adecuada una muestra de 26 observaciones solamente. Por esta raz6n, 40 de las 100 observaciones muestrales se afijaron a este estrato.

Si el unico objetivo de un estudio es estimar con la mayor precisi6n posible un panime. tro relativo al conjunto de la poblaci6n, como la media, el total 0 la proporci6n, y si se

tiene bastante informaci6n sobre la poblaci6n, es posible establecer una afijacion optima.

Afijacion optima: tamano de la muestra del j-esimo estrato, media 0 total del conjunto de la poblacion Si 10 que se necesita es estimar una media 0 un total del conjunto de una poblacion y si las varianzas poblacionales de los estratos individuales se representan por medio de (J2, puede demostrarse que los estimadores mas precisos se obtienen con la afijacion optima. E{ tamaiio de la muestra del j-esimo estrato utilizando la afijacion optima es

Na n. = J J X n

J K (20.20)

Esta f6rmula es razonable intuitivamente. Comparada con la afijaci6n proporcional, asigna relativamente mas esfuerzo muestral a los estratos en los que la varianza poblacional es mayor. Es decir, se necesita una muestra de mayor tamafio donde la variabilidad poblacional es mayor. Asi, en el ejemplo 20.4, en el que hemos utilizado la afijaci6n prop orcional, si las diferencias observadas en las desviaciones tipicas muestrales reflejaran correctamente las diferencias que existen en las cantidades poblacionales, habria sido preferible tomar menos observaciones en el tercer estrato y mas en el primero.

El uso de la ecuaci6n 20.20 plantea inmediatamente una objeci6n. Requiere conocer las desviaciones tfpicas poblacionales, aj , mientras que antes de que se tome la muestra, a menudo ni siquiera se dispone de estimaciones de estos valores que merezcan la pena. Esta cuesti6n se analiza en el ultimo apartado del capitulo.

A continuaci6n, se examina el tamafio de la muestra necesario en la afijaci6n 6ptima correspondiente a una proporci6n poblacional.

Afijacion optima: tamano de la muestra del j-esimo estrato, proporcion poblacional Para estimar la proporcion de la poblacion total, se obtienen estimadores con la menor varianza posible por medio de una afijaci6n optima. EI tamaiio de la muestra del j-esimo estrato de la proporcion poblacional utilizando la afijacion optima es

Nj J Pj(l - Pj) nj = K x n (20.21)

L Ni JPi(1 - Pi) i='

Page 25: Otros temas relacionados con el muestreo - Bibliotecabiblio3.url.edu.gt/Libros/2012/esta-AE/20.pdf · Muestreo bietapico Metodos de muestreo no probabilisticos Introducci6n Una gran

Capitulo 20. Otros temas relacionados con el muestreo 835

Esta formula, en comparacion con la afijacion proporcional, asigna mas observaciones muestrales a los estratos en los que las verdaderas proporciones poblacionales son mas cercanas a 0,5, pues si una proporcion es cercana a 0 0 a 1, puede saberse con bastante seguridad con una muestra relativamente pequefia. La dificultad que plantea el uso de la ecuacion 20.21 estriba en que implica las proporciones desconocidas Pj para (j = 1, 2, ... , K) , que son las propias cantidades que el estudio pretende estimar.

No obstante, a veces la informacion anterior sobre la poblacion puede permitir hacerse al menos una idea aproximada de que estratos tienen proporciones mas cercanas a 0,5. En el ejemplo 20.6, las proporciones muestrales sugieren que el numero de escuelas universitarias que hay en la muestra deberfa haber sido menor que el numero resultante de la afijacion proporcional. Se lIega a la misma conclusion en este estudio cuando se comparan las desviaciones tfpicas muestrales del ejemplo 20.5 con la ecuacion 20.20. A pesar de eso, se decidio incluir en la nuestra mas escuelas universitarias en lugar de menos. La razon era que en este estudio el editor querfa tener informacion fiable tanto sobre el mercado de escuelas universitarias como sobre el de facultades.

Esta ilustracion es un ejemplo de una importante cuestion. Aunque la division del esfuerzo muestral que sugieren las ecuaciones 20.20 y 20.21 a menudo se denomina afijacion optima, solo es optima con respecto al estricto criterio de la estimacion eficiente de los parametros con-espondientes al conjunto de la poblacion. A menudo, los estudios tienen objetivos mas amplios que ese, en cuyo caso puede muy bien ser razonable no utilizar la afijacion optima.

EJERCICIOS

Ejercicios aplicados

20.27. Una pequefia ciudad contiene un total de 1.800 hogares. La ciudad esta dividida en tres distritos, que contienen 820, 540 Y 440 hogares, respectivamente. Una muestra aleatoria estratificada de 300 hogares contiene 120, 90 Y 90 hogares, respectivamente, de estos tres distritos. Se pide a los miembros de la muestra que estimen su factura total de electricidad consumida en los meses de invierno. Las respectivas medias muestrales son 290 $, 352 $ Y 427 $ Y las respectivas desviaciones tfpicas muestrales son 47 $, 61 $ Y 93 $.

a) Utilice un metodo de estimaci6n insesgada para estimar la factura media de electricidad consumida en los meses de invierno por todos los hogares de esta ciudad.

b) Utilice un metodo de estimaci6n insesgada para estimar la varianza del estimador del apartado (a).

c) Halle el intervalo de confianza al 95 por ciento de la media poblacional de las facturas de electricidad consumida en invierno por los hog ares de esta ciudad.

20.28. Una universidad tiene 152 profesores ayudantes, 127 titulares y 208 catedn'iticos. Las autoridades universitarias estan investigando la cantidad de tiempo que dedican estos profesores a reuniones en un cuatrimestre. Se pi de a muestras aleatorias de 40 profesores ayudantes, 40 titulares y 50 catedraticos que lleven la cuenta del tiempo que dedican a reuniones en un cuatrimestre. Las medias muestrales son 27,6 horas en el caso de los profesores ayudantes, 39,2 en el de los titulares y 43,3 en el de los catedraticos. Las desviaciones tfpicas muestrales son 7,1 horas en el caso de los profesores ayudantes, 9,9 en el de los titulares y 12,3 en el de los catedraticos.

a) Halle un intervalo de confianza al 90 por ciento del tiempo medio dedicado a reuniones par los catedraticos de esta universidad en un cuatrimestre.

b) Utilice un metodo de estimaci6n insesgad<l para estimar el tiempo media dedicado a reuniones por todos los profesores de esta universidad en un cuatrimestre.

c) Halle intervalos de confianza del 90 y el 95 por ciento del tiempo medio dedicado a reu-

Page 26: Otros temas relacionados con el muestreo - Bibliotecabiblio3.url.edu.gt/Libros/2012/esta-AE/20.pdf · Muestreo bietapico Metodos de muestreo no probabilisticos Introducci6n Una gran

836 Estadfstica para administraci6n y economfa

niones por todos los profesores de esta universidad en un cuatrimestre.

20.29. Una empresa de autobuses esta planificando una nueva ruta para dar servicio a cuatra barrios. Se toman muestras aleatorias de hogares de cada barrio y se pide a los miembros de las muestras que valoren en una escala de 1 (totalmente en contra) a 5 (totalmente a favor) su reacci6n al servicio prapuesto. La tabla adjunta muestra los resultados.

Barrio 1 Barrio 2 Barrio 3 Barrio 4

N; 240 190 350 280 ni 40 40 40 40 Xi 2,5 3,6 3,9 2,8 Si 0,8 0,9 1,2 0,7

a) Halle un intervalo de confianza al 90 por ciento de la reacci6n media de los hogares de la barrio 1.

b) Utilice un metoda de estimaci6n insesgada para estimar la reacci6n media de todos los hogares a la nueva ruta.

c) Halle intervalos de confianza al 90 y al 95 por ciento de la reacci6n media de todos los hogares a la nueva ruta.

20.30. En una muestra aleatoria estratificada de estudiantes de una pequefia universidad, se pide a los miembros de la muestra que valoren en una escala de 1 (pocas) a 5 (muchas) las oportunidades para realizar actividades extracurriculares. La tabla adjunta muestra los resultados.

Estudiantes de primer Estudiantes de tercer y segundo aiio y cuarto aiio

N; 632 529 1'li 50 50 Xi 3,12 3,37 Sf 1,04 0,86

a) Halle el intervalo de confianza al 95 por ciento de la valoraci6n media que harlan todos los estudiantes de primer y segundo afio de este campus.

b) Halle el intervalo de confianza al 95 por ciento de la valoraci6n media que harfan todos los estudiantes de tercer y cuarto afio de este campus.

c) Halle el intervalo de confianza al 95 por ciento de la valoraci6n media que harlan todos los estudiantes de este campus.

20.31. Vuelva al ejercicio 20.28.

a) Halle el intervalo de confianza al 90 por ciento de la cantidad total de tiempo dedicada a reuniones por todos los profesores catedraticos de esta universidad en un cuatrimestre.

b) Halle el intervalo de confianza al 90 por ciento de la cantidad total de tiempo dedicada a reuniones por todos los prafesores de esta universidad en un cuatrimestre.

20.32. Una empresa tiene tres divisiones y los auditores estan intentado estimar la cantidad total de facturas pendientes de cobra de la empresa. Se toman muestras aleatorias de estas facturas en cada una de las tres divisiones y se obtienen los resultados que muestra la tabla.

Division 1 Division 2 Division 3

Ni 120 150 180 nj 40 45 50 Xi 237 $ 198 $ 131 $ S; 93 $ 64 $ 47 $

a) Uti lice un metoda de estimaci6n insesgada para hallar una estimaci6n puntual del valor total de todas las facturas pendientes de cobro de esta empresa.

b) Halle el intervalo de confianza al 95 por ciento del valor total de todas las facturas pendientes de cobra de esta empresa.

20.33. De las 1.395 universidades que hay en un pais, 364 son escuelas universitarias. En una muestra aleatoria de 40 escuelas universitarias, se observa que en 10 de elias se utiliza el libra de texto La estadistica puede ser divertida. En otra muestra aleatoria de 60 facultades, se utiliza este libra de texto en 8 de elias.

a) Estime la proporci6n de todas las universidades que utilizan este libra de texto empleando un metodo de estimaci6n insesgada.

b) Halle el intervalo de confianza al 95 por ciento de la proporci6n de todas las escuelas universitarias que utilizan este libro de texto.

20.34. Una consultora ha desarrollado un curso breve sobre metodos modernos de predicci6n para ejecutivos de empresa. Al primer curso han asistido 150 ejecutivos. Con la informaci6n suministrada por ellos, se ha Ilegado a la conclusi6n de que las cualificaciones tecnicas de 100 asistentes al curso eran mas que suficientes para seguir la materia, mientras que las de los 50 restantes no 10 eran. Despues de terminar el

Page 27: Otros temas relacionados con el muestreo - Bibliotecabiblio3.url.edu.gt/Libros/2012/esta-AE/20.pdf · Muestreo bietapico Metodos de muestreo no probabilisticos Introducci6n Una gran

Capitulo 20. Otros temas relacionados con el muestreo 837

curso, se han enviado cuestionarios a muestras aleatorias independientes de 25 personas de cada uno de estos grupos para obtener informacion con el fin de mejorar la presentacion de los cursos posteriores. Seis del grupo mas cualificado y 14 del grupo menos cualificado han indicado que creen que el curso es demasiado teorico.

a) Estime la proporcion de todos los asistentes al curso que tienen esta opinion utilizando un metodo de estimacion insesgada.

b) Halle intervalos de confianza al 90 por ciento y al 95 por ciento de esta proporcion poblacional.

20.35. Una universidad tiene 152 profesores ayudantes, 127 titulares y 208 catedraticos. Un periodista del periodico estudiantil tiene interes en saber si los profesores estan real mente en su despacho a las horas indicadas. Decide investigar muestras de 40 profesores ayudantes, 40 titulares y 50 catedraticos. Envfa estudiantes voluntarios a los despachos de los miembros de la muestra durante las horas indicadas. Se observa que 31 de los profesores ayudantes, 29 de los titulares y 34 de los catedraticos estan realmente en su despacho a esas horas.

a) Uti lice un metoda de estimacion insesgada para haHar una estimacion puntual de la propOl'cion de todos los profesores que estan en su despacho a las horas indicadas.

b) Halle el intervalo de confianza al 90 por ciento y al 95 por ciento de la proporcion de todos los profesores que estan en su despacho a las horas indicadas.

20.36. Vuelva al ejercicio 20.28. Si se toma una muestra total de 130 profesores, averigiie cuantos son catedraticos utili zando cada uno de los sistemas siguientes: