Estadística Inferencial: el Teorema del Límite Central

Unidad de Apoyo para el Aprendizaje

Iniciar

Introducción


El insumo de la estadística tanto descriptiva como inferencial es la información, por lo que la obtención de la muestra juega un papel central en la validez de los resultados. En estadística inferencial, con los valores recabados en una muestra, se puede deducir el valor de un parámetro de interés, lo que permitirá determinar el comportamiento de una población.

De tal forma que en este tema se expondrá uno de los resultados más importantes de la teoría de la probabilidad: el teorema del límite central.

En el ámbito empresarial y de los negocios, no siempre es posible contar con la información de toda una población, por lo que se tiene que recurrir a la estadística inferencial y, en particular, al teorema del límite central, el cual nos garantiza la representatividad de la población objeto de estudio.

¡Comencemos!



grupo de personas

Altmann, G. (2016). Grupo [ilustración]. Tomada de https://pixabay.com/es/icono-persona-grupo-personas-1250084/

El estudio de este tema te permitirá:

Identificar las características del teorema del límite central, a partir de la revisión de diferentes ejemplos, para que al aplicarlo se garantice la representatividad de una población objeto de estudio.

Teorema del límite central


En la teoría de probabilidad existen dos resultados muy importantes: la ley de los grandes números y el teorema del límite central, este último garantiza que el promedio de una muestra siga una distribución normal.

El teorema del límite central establece que si se cuenta con un conjunto de variables aleatorias X1, X2, ..., Xn, las cuales son independientes e idénticamente distribuidas con valor esperado


E(X1) = E(X2) =...= E(Xn) = μ



y varianza


V(X1) = V(X2) =...= V(Xn) = σ2



entonces, a medida que se incrementa el número de variables (n),





Donde:

: promedio de n variables

: distribución normal con media µ y varianza σ2/n

El resultado indica que la distribución del promedio del conjunto de variables se aproxima a una normal con media μ y varianza σ2, conforme el tamaño de la muestra se incrementa.

Este resultado es aplicable al muestreo, donde los elementos de la muestra pueden considerarse como variables aleatorias independientes con la misma distribución de la población de la que proceden con media μ y varianza σ2.

Así, el promedio muestral conforme el tamaño de la muestra se incrementa se aproxima a una distribución normal con media μ y varianza σ2/n.

Para entender mejor este resultado, supóngase que de una población con media μ y varianza σ2 se extraen N muestras aleatorias de tamaño n, y con cada una se calcula el promedio. Si se construye un histograma con los N promedios, tendría una forma acampanada alrededor del punto μ y su varianza se aproxima a σ2/ n.

Para ejemplificar lo anterior:

Supóngase que se desea conocer el comportamiento del promedio del lanzamiento de un dado. Asumiendo que el dado no se encuentra cargado en ningún número, cualquier valor tiene la misma probabilidad de ser elegido (1/6), por lo que el valor esperado (μ) es el siguiente:

(s. a.) (2017). Juego de mesa [fotografía]. Tomada de https://pxhere.com/es/photo/893719


(s. a.) (2017). Juego de mesa [fotografía]. Tomada de https://pxhere.com/es/photo/893719



μ=E(X)=1∙1/6+2∙1/6+3∙1/6+4∙1/6+5∙1/6+6∙1/6=3.5



Y la varianza (σ2):



σ2=E(X2)- E2(X2)



Donde:



E(X2)=12∙1/6+22∙1/6+32∙1/6+42∙1/6+52∙1/6+62∙1/6=15.2



Así



σ2=E(X2)- E2(X2)
σ2=15.2- 3.52
σ2=2.9



Supóngase que se lanza un dado dos veces (n = 2) y se calcula el promedio de los dos resultados, luego, se repite este experimento 100 ocasiones (N = 100). Se obtienen los resultados que se muestran a continuación.



resultados de dos lanzamientos


Rodríguez, A. y García, M. (2012). Resultados de dos lanzamientos de un dado en 100 ocasiones [imagen]. Tomada Estadística II [Versión electrónica].



La tabla anterior ejemplifica los resultados de las 100 muestras de dos lanzamientos y sus respectivos promedios. Obsérvese que el promedio de los promedios es 3.6 (cercano a 3.5, el valor esperado); y la varianza de los promedios (1.3), que se acerca a 2.9/2 = 1.45.

La siguiente figura muestra el histograma de la distribución del promedio de dos lanzamientos, junto con la distribución teórica a la que debería aproximarse.



distribución del promedio


Rodríguez, A. y García, M. (2012). Distribución del promedio de dos lanzamientos de un dado [imagen]. Tomada Estadística II [Versión electrónica].



Ahora, supóngase que en vez de realizar dos lanzamientos se hicieran cinco, se calculara el promedio y se repitiera este experimento 100 ocasiones. En la siguiente tabla se muestran los resultados.



resultados de cinco lanzamientos


Rodríguez, A. y García, M. (2012). Resultados de cinco lanzamientos de un dado en 100 ocasiones [imagen]. Tomada de Estadística II [Versión electrónica].



En el caso de 100 muestras de tamaño cinco, el promedio de los promedios es 3.5, el valor esperado del lanzamiento de un dado; y la varianza de los promedios es 0.6, la cual es casi 2.9/5 = 0.58.

La siguiente figura es la gráfica de la distribución de los promedios de las 100 muestras con la distribución teórica a la que debe aproximarse.



distribución del promedio


Rodríguez, A. y García, M. (2012). Distribución del promedio de cinco lanzamientos de un dado [imagen]. Tomada de Estadística II [Versión electrónica].



Obsérvese que la dispersión va disminuyendo; ahora el promedio se sitúa entre 2 y 5, y ya no incluye los valores extremos.

Conforme se incrementa el número de lanzamientos, la distribución de frecuencias se concentra cada vez más alrededor de 3.5 y se asemeja más a una distribución normal con media 3.5 y varianza 2.9/n.

En la siguiente figura se expone la distribución de frecuencias de 100 muestras de tamaño de 10, 30, 50 y 100 lanzamientos.



distribución de cien muestras


Rodríguez, A. y García, M. (2012). Distribución del promedio de cien muestras de 10, 30, 50 y 100 lanzamientos de un dado [imagen]. Tomada de Estadística II [Versión electrónica].



El teorema de límite central se comprueba con las figuras anteriores, conforme se incrementa el número de lanzamientos de una moneda se asegura su convergencia hacia una distribución normal, a la vez que su variabilidad disminuye.







Actividad. Teorema… ¿qué?

El teorema del límite central es un tema fundamental de probabilidad y estadística, ya que los datos que éstos utilizan para sus procedimientos deben ser representativos de la población con la que se está trabajando, y el teorema les permitirá obtenerlos.

En esta actividad debes identificar si las características que se exponen del teorema del límite central son Falsas o Verdaderas; al contestar, considera los ejemplos revisados. Al finalizar podrás conocer tu desempeño.

Autoevaluación. Variables y fórmulas

Considerando los distintos elementos del teorema del límite central y su importancia en la estadística inferencial, resulta esencial que se conozcan las variables y fórmulas clave que se utilizan al momento de calcular el tamaño de una muestra.

A continuación las deberás identificar; elige la opción correcta de acuerdo con la descripción proporcionada. Al finalizar podrás conocer tu desempeño.

Fuentes de información

Básicas

Bibliografía

Anderson, S. (2012). Estadística para negocios y economía (11.ª ed.). México: Cengage Learning.

Levin, R. y Rubin, D. (2010). Estadística para administración y economía (7.ª ed.). México: Pearson Educación.

Documentos electrónicos

Rodríguez, A. y García, M. (2012). (2012). Estadística II [Versión electrónica]. México: SUAYED-FCA-UNAM. Consultado el 10 de abril de 2018 de http://fcasua.contad.unam.mx/apuntes/interiores/docs/20172/contaduria/3/apunte/LC_1353_03106_A_estadisticaII.pdf

Complementarias

Lind, A. D., Marchal, G., W. y Wathen, S. (2012). Estadística aplicada a los negocios y economía (15.ª ed.). México: McGraw-Hill.


Cómo citar