ESTIMACIÓN ESTADÍSTICA
1. Se ha medido la variable "compresión lectora" en una muestra de 36 alumnos, obteniéndose una media de 9.64 y una desviación típica de 4.9. A partir de estos datos, ¿Entre qué valores se encontrará la media de la población a la que pertenece la muestra, con un nivel de confianza del 95%?. Si aumentamos el tamaño de la muestra, ¿cómo influye en la amplitud del intervalo de confianza de la media?
2. Tenemos una población de 4 individuos, en los que se ha medido una característica X, obteniéndose los valores:
X | 1 | 3 | 5 | 7 |
En la tabla siguiente podemos ver todas las posibles muestras de tamaño 2 obtenidas de la población anterior, y las medias de cada una de estas muestras:
Muestra | Media | Muestra | Media |
[1,1] | 1 | [5,1] | 3 |
[1,3] | 2 | [5,3] | 4 |
[1,5] | 3 | [5,5] | 5 |
[1,7] | 4 | [5,7] | 6 |
[3,1] | 2 | [7,1] | 4 |
[3,3] | 3 | [7,3] | 5 |
[3,5] | 4 | [7,5] | 6 |
[3,7] | 5 | [7,7] | 7 |
Se pide: i) Hallar la media y desviación típica de la población.
ii) Hallar la media y desviación típica de la distribución de medias de las muestras de tamaño 2 y compararlas con los valores obtenidos para media y desviación típica de la población, expresando, si existe, las relaciones respectivas.
3. Un fabricante de pilas ha hecho un estudio de la duración de las mismas, concluyendo que su duración media es de aproximadamente 50 horas. Se sabe que dicha vida media es una variable aleatoria normal con desviación típica 10. Se desea saber cuál es el tamaño de la muestra necesaria para que la media estimada difiera de 50 horas en menos de una hora, con un nivel de confianza del 95%.
4. En una muestra de 100 individuos, extraída al azar de una población de empleados de banca, se ha estudiado el factor "realización personal", y se ha obtenido una media de 40 y una desviación típica igual a 12.
i) Estimar la media del factor "realización personal" en toda la población de empleados de banca con un riesgo del 5%.
ii) Indica, justificándolo, en qué caso de los que se detallan a continuación se introduciría menor error de sesgo al elegir la muestra de empleados/as:
1.- Extrayendo los 100 nombres entre los empleados de un gran banco de Madrid.
2.- Preguntando a 100 empleados de banca que participan en una asamblea a la que asisten 2.000 trabajadores de banca.
3.- Eligiendo 100 nombres en un listín en que aparecen ordenados alfabéticamente las personas que trabajan en la banca.
5. Un fabricante de lámpara eléctricas está ensayando un nuevo método de producción que se considerará aceptable si las lámparas obtenidas por este método dan lugar a una población normal de duración media 2.400 horas, con una desviación típica igual a 300.Se toma una muestra de 100 lámparas producidas por este método, y esta muestra da una duración media de 2.320 horas. ¿Se puede aceptar la hipótesis de validez del nuevo proceso de fabricación con un riesgo igual o menor al 5%? Formula la hipótesis alternativa. Define error de tipo I y error de tipo II.
6. Una muestra de cien hombres de una gran ciudad ha dado para sus estaturas (que se admite que tienen una distribución normal con una desviación típica =0.20 m.) una media de 1.78 m. Se pide obtener un intervalo de confianza al 95% para la media poblacional. ¿Cuál debería ser el tamaño de la muestra para que el intervalo de confianza fuera (1.76, 1.80) m.? ¿Cómo influye el tamaño de la muestra en la amplitud del intervalo de confianza?
7. Se garantiza una duración media de 850 horas para una marca de lámparas de 60W, (esta variable vida media se distribuye normalmente con desviación típica =120 horas). De un partida recién fabricada, se extrae una muestra de 64 lámparas, realizándose un estudio acerca de su duración que proporciona una media de 750 horas. ¿Sería preciso rechazar este lote por no cumplir la garantía, con un nivel de confianza del 95%? ¿Cuál sería la mínima duración media de la muestra que permitiría no rechazar el lote con el mismo nivel de confianza?
8. Tras múltiples observaciones se ha comprobado que el número de pulsaciones de los varones de 20 a 25 años se distribuye normalmente con una media de 72 pulsaciones y una desviación típica igual a 9.si una muestra de 100 deportistas varones de esa edad da una media de 64 pulsaciones. ¿Queda el valor de 72 pulsaciones dentro del intervalo de la media muestral al 95% de confianza? ¿Debemos aceptar la hipótesis de que no hay diferencia significativa entre el número de pulsaciones de deportistas y de varones en general con un nivel de significación de 0.05? Enuncie la hipótesis alternativa y defina el error de tipo I y error de tipo II. . . . . . . . . . . . . (Septiembre-97)
9. El estudio de una muestra aleatoria de 100 jóvenes que se presentan a una prueba para a una prueba para un puesto de trabajo, en el ayuntamiento de una gran ciudad, revela que la edad media es de 20.2 años. Sabiendo que la variable estudiada se distribuye normalmente en la población con desviación típica 10. ¿Podemos aceptar con un 95% de confianza el valor de 22 años como media de edad de todos los que concurren a la prueba? ¿Cuál debería ser el tamaño de la muestra para que el intervalo de confianza de la media muestral fuera 20.2±1.78 con el mismo nivel de significación? . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . (Junio-97)
10. Un fabricante de juguetes electrónicos garantiza una duración media de 100 horas en sus productos. Para efectuar un control de calidad sobre un lote de juguetes de un mismo modelo recientemente fabricados, se estudia de una muestra de 36 juguetes, obteniéndose una media de 97 horas, (la variable estudiada se distribuye normalmente siendo la desviación típica de la población igual a 10). Con una confianza del 95% ¿Debemos rechazar la producción por no cumplir con la duración garantizada? ¿Debemos rechazar la producción si deseamos una confianza del 99%? ¿Y si la muestra que elegimos es de 50 juguetes y la confianza del 95%? . . . . . . . . . . . . . . . (Junio-97)
11. Se sabe que en una muestra de 36 alumnos se ha medido la variable "velocidad lectora" y el valor medio obtenido para la media ha sido 9.6. Suponiendo que esta variable tiene una distribución normal en la población con una desviación típica de 4.9 ¿Se puede aceptar la hipótesis de la media poblacional de esta variable es µ=15, con un riesgo igual o menor al 5%? Explica lo que se entiende por error de tipo I y error de tipo II.
12. En una empresa se quiere realizar una encuesta por el método de muestreo estratificado entre sus 800 empleados. Se pretende que la muestra, de tamaño 160, sea representativa por sexo y edad. Para la edad se establecen 5 estratos en los que se distribuyen los empleados/as como se indica en la tabla. Por sexo la distribución es 380 hombres y 420 mujeres distribuidos proporcionalmente a cada grupo de edad. Determina, redondeando si es preciso, a cuántos empleados y empleadas de cada estrato se ha de preguntar. . . . . . . . . . . . . . . . . . . (Septiembre-98)
25-30 | 31-35 | 36-40 | 41-45 | >45 | |
Empleados/as | 180 | 170 | 210 | 180 | 60 |
13. En una empresa de exportación de cítricos se investiga el peso medio de cierta variedad de naranjas. Se admite un error máximo de 10 gramos, con una confianza del 95%. Se sabe por estudios de otros años que el peso medio se distribuye normalmente siendo la desviación típica de 60 gramos. ¿Cuál ha de ser el tamaño mínimo de la muestra a elegir? ¿Y si se desea una confianza del 99%? . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . (Septiembre-98)
14. El estudio de un test de satisfacción de usuario que rellenan todos los demandantes de servicios de una gran empresa revela que la nota media que otorgan es de 5.70 puntos con una desviación típica de 0.5. Posteriormente se ha realizado un muestreo a 100 usuarios de la zona de influencia A, y a 49 usuarios de la zona B, obteniéndose puntuaciones medias respectivas de 5.6 y 5.85. Con una confianza del 95%. ¿Se puede afirmar que las diferencias entre las medias de cada muestra y de la población son debidas al azar, o se puede afirmar que son diferentes la nota media de la población y la de cada muestra? Formula la hipótesis nula y alternativa. Define el error tipo I y error tipo II.
15. Se sabe que el contenido de fructosa de cierto alimento sigue una distribución normal cuya varianza es conocida teniendo un valor de 0.25. Se desea estimar el valor de la media poblacional mediante el valor de la media muestral de una muestra, admitiéndose un error máximo de 0.2 con una confianza del 95%. ¿Cuál ha de ser el tamaño de la muestra? . . . . . . . . . . . . . . . . . . (Junio-99)
16. Un laboratorio ha preparado un elevado número de dosis de una cierta vacuna. Se conoce que el peso de dichas dosis se distribuye normalmente con una desviación típica de 0,10 mg. El peso medio de las dosis ha de ser 0,70 mg. Se requiere la máxima precisión en el peso de las dosis, por ello se elige una muestra de 200 dosis y se comprueba su peso medio que resulta ser 0,66 mg. Realiza un contraste de hipótesis con un nivel de significación de 0,05 para decidir si se deben retirar las dosis producidas, o bien la diferencia de peso medio es debida al azar. Indica que se entiende por hipótesis nula e hipótesis alternativa. . . . . . . . . . . . . . . . . . . .. . . . . . (Septiembre-99)
17. Queremos estimar la media de una variable aleatoria que se distribuye normalmente don una desviación típica de 3,2. Para ello, se toma una muestra de 64 individuos obteniéndose una media de 32,5. ¿Con qué nivel de confianza se puede afirmar que la media de la población está entre 31,5 y 33,5? Si la desviación típica de la población fuera 3. ¿Cuál es el tamaño mínimo que debería tener la muestra con la cual estimamos la media poblacional si queremos que el nivel de confianza sea del 99% y el error admisible no supere el valor de 0,75? . . . . . . . . . . . . . . . . . . . (Junio-2.000)
18. Según un estudio realizado durante el año 1.999 en un hospital, la distribución de los pesos de los recién nacidos fue una Normal con media 3,450 Kg. y desviación típica 0,52 Kg. A lo largo de este año se ha analizado el peso de 36 recién nacidos tomados al azar, obteniéndose una media de 3,300 Kg. ¿Podemos afirmar que esta diferencia es debida al azar con una confianza del 95%? Con el mismo nivel de confianza, ¿cambiaría la respuesta si la media de 3,300 Kg se hubiera obtenido al analizar el peso de 81 recién nacidos tomados al azar? . . . . . . . . . . . (Septiembre-2.000)
19. En el último campeonato regional de maratón, la variable "tiempo empleado en recorrer la distancia de 42 km. Y 195 m." se distribuyó normalmente con una desviación típica de 0,49 horas. En una muestra de 38 atletas, se ha medido la misma variable y el valor obtenido para la media es de 3,29 horas. Halla el intervalo de confianza para la media poblacional con una confianza del 85% y explica el significado de este intervalo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . (Propuesto-2.000)
20. Un fabricante de ropa deportiva quiere realizar una encuesta por el método de muestreo estratificado entre los 345 atletas participantes en una prueba de maratón. La muestra, de tamaño 52, ha de ser representativa por sexo y edad. Para la edad se establecen cuatro estratos:
Edad (en años) | 18 - 30 | 31 - 43 | 44 - 56 | más de 56 |
Nº de atletas | 146 | 114 | 51 | 34 |
Por sexos la distribución es 53 mujeres y 292 hombres distribuidos proporcionalmente a cada grupo de edad. Determina, redondeando si es preciso, el número de atletas femeninos y el número de atletas masculinos de cada uno de los cuatro estratos a los que se ha de encuestar.
(Propuesto-2.000)
21. Según un estudio realizado por una empresa hostelera durante el año 1.992, la distribución del tiempo de estancia de cada viajero fue normal con una media de 3.7 días y una desviación típica de 1.1 días. A lo largo del año 2.000 se analizó el tiempo de estancia de 49 viajeros elegidos al azar, obteniéndose una media de 3.5 días. ¿Podemos afirmar que esta diferencia es debida al azar con una confianza del 88%? Con el mismo nivel de confianza, ¿cambiaría la respuesta si esta media de 3.5 días se hubiera obtenido al analizar el tiempo de estancia de 100 viajeros elegidos al azar?
(Junio 2.001)
22. En una prueba ciclista de contra-reloj, la variable aleatoria: "Tiempo que tarda el corredor en recorrer la distancia de 22 Km" se distribuye normalmente con una desviación típica de 3 minutos. Queremos estimar la media de la población. ¿Cuál es el tamaño mínimo que debería tener la muestra que hemos de tomar si queremos que el nivel de confianza sea del 94% y el error admisible no supere el valor de 0'8? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . (Septiembre 2.001)
23. Una productora de cine quiere realizar una encuesta por el método de muestreo estratificado entre las 918 personas asistentes a la proyección de una de sus películas. La muestra de tamaño 54 ha de ser representativa por sexo y edad. Para la edad se establecen cuatro estratos:
Edad (en años) | 18 - 31 | 32 - 44 | 45 - 57 | Más de 57 |
Nº de personas | 253 | 305 | 206 | 154 |
Por sexos la distribución es de 301 mujeres y 617 hombres repartidos proporcionalmente a cada grupo de edad. Determina, redondeando si es preciso, el número de mujeres y el número de hombres de cada uno de los cuatro estratos a los que se ha de pasar la encuesta.
(Propuesto-2.001)
24. En una de las pruebas de acceso a la Universidad, la variable "puntuación obtenida en la materia de Matemáticas Aplicadas a las Ciencias Sociales II" se distribuye normalmente con una desviación típica de 1,38. En una muestra de 50 alumnos se ha medido la misma variable y el valor obtenido para la media es de 4,93 puntos. Halla un intervalo de confianza para la media poblacional con una confianza del 92% y explica el significado de este intervalo.
(Propuesto-2.001)
SOLUCIONES
1. (8.04 , 11.24). Si aumentamos el tamaño muestral disminuye la amplitud del intervalo.
2. i) µ=4 sigma=2,236 ii) Media muestral=4 Desviación típica=1,581
La media muestral coincide con la poblacional. La desviación típica muestral es la poblacional partida por la raíz cuadrada del tamaño muestral.
3. 385
4. i) (37.648 , 42.352)
ii) 3ª opción, ya que la muestra es más representativa, al ser un muestreo aleatorio.
5. (2261.2 , 2378.8) No se puede aceptar la hipótesis.
H1: Las lámparas fabricadas no tienen duración media de 2400 horas.
Error tipo I: Rechazar el proceso de fabricación siendo bueno.
Error tipo II: Aceptar el proceso de fabricación siendo malo.
6. (1.74 , 1.82) n=385
Si aumentamos el tamaño muestral disminuye la amplitud del intervalo.
7. (720.6 , 779.4) Sería preciso rechazar el lote. 820.6 horas.
8. (62.64 , 65.76) No queda dentro del intervalo.
No debemos aceptar la hipótesis de que no existen diferencias significativas entre el número de pulsaciones de deportistas y varones.
H1: El número de pulsaciones en varones y deportistas no es igual.
Error tipo I: Rechazar que el número de pulsaciones es igual siendo igual.
Error tipo II: Aceptar que el número de pulsaciones es igual siendo desigual.
9. (18.24 , 22.16) Si podemos aceptar el valor de 22 años. n=122.
10. (93.73 , 100.27) No debemos rechazar la producción.
(92.71 , 101.29) No debemos rechazar la producción.
(94.23 , 99.77) Si debemos rechazar la producción.
11. (8 , 11.2) No debemos aceptar que la media de la población sea 15.
Error tipo I: Rechazar que la media de la población es 15 siendo 15.
Error tipo II: Aceptar que la media de la población no es 15 siendo 15.
12. El número por edad y sexo forma la siguiente tabla:
25 - 30 | 31 - 35 | 36 - 40 | 41 - 45 | Más de 45 | |
Mujeres | 19 | 18 | 22 | 19 | 6 |
Hombres | 17 | 16 | 20 | 17 | 6 |
Total | 36 | 34 | 42 | 36 | 12 |
13. n=139. n=239
14. A (5.502 , 5.698) B (5.71 , 5.99)
En ambos casos aceptar que la diferencia de medias se debe al azar.
H0: La nota media de la zona A (o B) es igual a la de la empresa.
H1: La nota media de la zona A (o B) es distinta a la de la empresa.
Error tipo I: Rechazar que son iguales las notas cuando no lo son.
Error tipo II: Aceptar que son iguales las notas cuando son distintas.
15. 25.
16. (0'6461, 0'6739), se debe retirar las dosis.
H0: La media es 0,70. µ=0,70 H1: La media no es 0,70. µ0,70.
17. 98,76% n mayor o igual que107.
18. No podemos afirmar que la diferencia se debe al azar en ninguno de los dos casos.
19. (3'1755 , 3'404)
Significa que el 85% de los corredores tardan entre 3'18 horas y 3'40 horas en recorrer la distancia del maratón.
20. El número de atletas, por sexo y edad, forman la siguiente tabla.
18 - 30 | 31 - 43 | 44 - 56 | más de 56 | Total | |
Mujeres | 3 | 3 | 1 | 1 | 8 |
Hombres | 19 | 14 | 7 | 4 | 44 |
Total | 22 | 17 | 8 | 5 | 52 |
21. Si podemos afirmar que se debe al azar. . . . . . . . Si cambiaría la respuesta.
22. 50.
23. El número de asistentes, por sexo y edad, forman la siguiente tabla:
18 - 31 | 32 - 44 | 45 - 57 | Más de 57 | |
Mujeres | 5 | 6 | 4 | 3 |
Hombres | 10 | 12 | 8 | 6 |
Total | 15 | 18 | 12 | 9 |
24. (4'62 , 5'30)