Estadística Inferencial: Estimación de una Media con Muestras Grandes
Unidad de Apoyo para el Aprendizaje
Iniciar
Con frecuencia, las organizaciones requieren tener indicios del comportamiento de cierta variable de interés. Por ejemplo, una organización no gubernamental, dedicada a implementar programas en comunidades rurales para mejorar la nutrición de niños entre seis y 12 años, querría conocer el promedio de ingesta calórica de esta población. Se observa que el comportamiento de la población está determinado por el valor de un parámetro desconocido, el cual se calculará con la información de una muestra.
Para lograrlo, se utiliza el procedimiento de la estimación de una media con muestras grandes, en este tema se abordarán sus características.
¡Comencemos!
(s. a.) (2007). Niños mazatecos [fotografía]. Tomada de https://commons.wikimedia.org/wiki/File:Ni%C3%B1os_mazatecos.jpg
El teorema del límite central garantiza que, conforme aumenta el tamaño de la muestra, la distribución del promedio muestral se acerca a una distribución normal cuya media es el promedio poblacional, y la varianza es la varianza poblacional entre el tamaño de la muestra. Como regla general tenemos que:
Se considera que con un tamaño de muestra de al menos 30 elementos, la distribución del promedio muestral sigue una distribución normal.
Teniendo presente esta regla, en muestras grandes (al menos de 30 elementos) se empleará una distribución normal para realizar una estimación por intervalo de la media.
Elementos para realizar la estimación puntual y por intervalo de la media (promedio) con muestras grandes
En la tabla anterior, columna cinco, se muestra el estimador puntual de la media poblacional, que es el promedio muestral. En la columna cuatro, se presenta cómo calcular el intervalo de confianza. En este caso, cuando se conoce la varianza poblacional, se utiliza en los cálculos; de no ser así, se estima este valor empleando la varianza muestral.
El valor Z representa el nivel de confianza buscado; en este planteamiento, z es el cuantil de una distribución normal estándar (Z) que parte la curva en dos áreas, una con valor 1−α/2 y otra de α/2, siendo α un valor entre 0 y 1.
En la columna seis se muestra la desviación del estimador, acorde con el teorema del límite central.
Para calcular el valor de z se puede recurrir a tablas o algún paquete de hoja de cálculo como MS Excel.
En Excel se emplea la siguiente función para calcular el cuantil z, donde se acumula una probabilidad de 1−α/2 (0 ‹ α ‹ 1):
=DISTR.NORM.ESTAND.INV(probabilidad)
A continuación se ilustra el valor que calcula la fórmula:
Valor calculado con la fórmula de Excel DISTR.NORM.ESTAND.INV(probabilidad)
En la figura anterior, en el valor encerrado en el círculo rojo se encuentra el punto que estima la fórmula. La información que se introduce en la fórmula es el área acumulada del lado izquierdo de z.
Veamos el siguiente ejemplo. Supóngase que se desea realizar una estimación con un nivel de confianza del 95 %, entonces:
Estimación, nivel de confianza de 95 %
Entonces, el valor z es el siguiente:
=DISTR.NORM.ESTAND.INV(1-0.025) =1.96
En la siguiente tabla se muestran los valores de z para los niveles de confianza más usados:
Valores de z
Con el propósito de mostrar los pasos a seguir para calcular las estimaciones de una media muestral grande, se presentan los siguientes casos prácticos.
Caso 1
El director financiero de una agencia de publicidad desea conocer el gasto promedio de la organización, pues está preocupado por el nivel de gasto registrado recientemente. Por tal motivo, realiza una auditoría a 30 facturas elegidas al azar. La información de las erogaciones seleccionadas se muestra a continuación:
Monto de las facturas auditadas
Con la información de esta muestra, procede lo siguiente:
Para solucionar este ejercicio se sugiere realizar lo siguiente:
Primer ejemplo
Conforme a la estimación puntual, el promedio de gastos de la organización es de $64.06 (miles). De acuerdo con la estimación por intervalo, el gasto promedio de la organización a un nivel de confianza del 99 % se sitúa entre $52.22 y $75.91 (miles). Es decir:
Caso 2
Una farmacéutica cuenta con 500 representantes médicos. Con la intención de diseñar un plan de incentivos, se quiere conocer el promedio de visitas que realizan los representantes, para lo cual se analizó una muestra de 35 representantes médicos elegidos al azar. En la siguiente tabla se muestran las visitas realizadas en un día por 35 representantes seleccionados:
Número de visitas realizadas
Con la información de esta muestra procede lo siguiente:
Para solucionar este ejercicio se sugiere realizar lo siguiente:
Segundo ejemplo
Con base en la estimación puntual, el promedio de visitas diarias efectuadas por un representante médico es de seis. Conforme a la estimación por intervalo, el promedio de visitas que realiza un representante médico al día con un nivel de confianza del 95 % se sitúa entre seis y siete.
Actividad. Muestras grandes
La estimación de una media con muestras grandes se puede obtener mediante dos cálculos: estimación por punto y por intervalo; al desarrollarlos se podrá llegar a la interpretación de resultados.
En esta actividad debes identificar si las características que se exponen de la estimación de una media con muestras grandes son Falsas o Verdaderas; al contestar, considera los ejemplos revisados. Al finalizar podrás conocer tu desempeño.
Autoevaluación. Fórmulas
Considerando los distintos elementos de la estimación de una media, por punto y por intervalo, con muestras grandes, resulta esencial que se conozcan sus fórmulas.
A continuación las deberás identificar, elige la opción correcta de acuerdo con la descripción proporcionada. Al finalizar podrás conocer tu desempeño.