Si el salario promedio es de $ 71,401, con una desviación estándar de $ 26,145, ¿cuál es la probabilidad de que una muestra aleatoria de 100 personas tenga un salario promedio inferior a $ 65,000?

Aunque Steven Smith siempre tiene razón, calificaría un poco su respuesta.

Fue muy rápido al decir que el tamaño de la muestra era lo suficientemente grande como para usar una aproximación normal. Eso es cierto cerca del centro de la distribución, pero esto está en la cola del 0.7%. Es probable que el error absoluto sea pequeño, pero el error relativo puede ser grande.

Por ejemplo, es completamente posible que la respuesta sea cero. Suponga que el 94.34% de las personas gana exactamente $ 65,000 y el 5.66% gana $ 178,191. Eso satisface la media y la desviación estándar especificada, pero obviamente no hay posibilidad de una muestra con una media inferior a $ 65,000. Si bien ese ejemplo específico no es realista, si estos fueran, por ejemplo, los salarios de los graduados de una buena escuela de derecho, es posible que el salario más bajo supere los $ 65,000, pero la media es de $ 71,401 y la desviación estándar aún es de $ 26,146. Significaría que muchas personas están cerca del mínimo del rango y algunas personas que ganan tres veces más, pero podría suceder.

También es posible que la probabilidad sea casi el doble del 0.7%. Si el 11.82% de las personas ganan cero y el 88.18% gana $ 80,975, hay una probabilidad del 1.3% de que una muestra de 100 tenga una media de menos de $ 65,000. Nuevamente, si bien ese ejemplo exacto no es realista, suponga que el 12% de la población no tiene trabajo y el resto tiene salarios en un rango razonablemente ajustado de alrededor de $ 80,000.

Todo esto supone que la población es muy grande. Con una población más pequeña, la probabilidad obviamente disminuye (si la población fuera 100, la probabilidad sería cero, independientemente de la distribución).

Cuando se usa una aproximación normal, creo que es una buena idea probar los extremos de las distribuciones binomiales que coinciden con la media y la desviación estándar, en este caso el extremo con algunas personas que ganan cero y el extremo con algunas personas que ganan $ 65,000. Eso te da una idea del rango de posibles respuestas. Como generalmente no espera los extremos, pero algo más como una distribución en forma de campana, puede concluir en este caso que 0.7% es una estimación razonable, pero podría ser, digamos 0.04% a 0.10% sin presentar distribuciones poco probables.

Como la muestra es suficientemente grande, podemos aplicar el teorema del límite central aquí.

Por lo tanto:

[matemáticas] \ mu _ {\ bar {X}} \ aprox \ $ 71,401 [/ matemáticas]

[matemáticas] \ sigma _ {\ bar {X}} \ aprox \ dfrac {\ $ 26,145} {\ sqrt {100}} = \ $ 2614.5 [/ matemáticas]

[matemáticas] P (\ bar {X} <\ $ 65000) \ aprox. P \ left (\ dfrac {\ bar {X} - \ mu _ {\ bar {X}}} {\ sigma _ {\ bar {X}}} <\ dfrac {\ $ 65000 - \ $ 71,401} {\ $ 2614.5} \ right) [/ math]

[matemáticas] P (\ bar {X} <\ $ 65000) \ aprox. P \ izquierda (Z <- \ dfrac {12802} {5229} \ derecha) [/ matemáticas]

[matemática] P (\ bar {X} <\ $ 65000) \ aproximadamente 0.0071772168 [/ matemática]