Teorema del límite central

Si se seleccionan muestras aleatorias de n observaciones de una población con media y desviación estándar , entonces, cuando n es grande, la distribución muestral de medias tendrá aproximadamente una distribución normal con una media igual a y una desviación estándar de . La aproximación será cada vez más exacta a medida de que n sea cada vez mayor.

Ejemplo

Para la dsitribución muestral de medias del ejercicio pasado, encuentre:

  1. El error muestral de cada media
  2. La media de los errores muestrales
  3. La desviación estándar de los errores muestrales.

Solución:

  1. En la tabla siguiente se ven las muestras, las medias de las muestras y los errores muestrales:
  2. Muestra

    x

    Error muestral, e=x-

    (0,0)

    0

    0 - 3 = -3

    (0,2)

    1

    1 - 3 = -2

    (0,4)

    2

    2 - 3 = -1

    (0,6)

    3

    3 3 = 0

    (2,0)

    1

    1 3 = -2

    (2,2)

    2

    2 3 = -1

    (2,4)

    3

    3 3 = 0

    (2,6)

    4

    4 3 = 1

    (4,0)

    2

    2 3 = -1

    (4,2)

    3

    3 3 = 0

    (4,4)

    4

    4 3 = 1

    (4,6)

    5

    5 3 = 2

    (6,0)

    3

    3 3 = 0

    (6,2)

    4

    4 3 = 1

    (6,4)

    5

    5 3 = 2

    (6,6)

    6

    6 3 = 3

  3. La media de los errores muestrales es e, es:
  4. La desviación estándar de la distribución de los errores muestrales
e, es entonces:

La desviación estándar de la distribución muestral de un estadístico se conoce como error estándar del estadístico. Para el ejercicio anterior el error estándar de la media denotado por x, es 1.58. Con esto se puede demostrar que si de una población se eligen muestras de tamaño n con reemplazo, entonces el error estándar de la media es igual a la desviación estándar de la distribución de los errores muestrales.

En general se tiene:

Cuando las muestras se toman de una población pequeña y sin reemplazo, se puede usar la formula siguiente para encontrar x .

donde es la desviación estándar de la población de donde se toman las muestras, n es el tamaño de la muestra y N el de la población.

Como rfegla de cálculo, si el muestreo se hace sin reemplazo y el tamaño de la población es al menos 20 veces el tamaño de la muestra (N20), entonces se puede usar la fórmula.

El factor se denomina factor de corrección para una población finita.

Ejemplo:

Suponga que la tabla siguiente muestra la antiguedad en años en el trabajo de tres maestros universitarios de matemáticas:

Maestro de matemáticas

Antiguedad

A

6

B

4

C

2

Suponga además que se seleccionan muestras aleatorias de tamaño 2 sin reemplazo. Calcule la antigüedad media para cada muestra, la media de la distribución muestral y el error estándar, o la desviación estándar de la distribución muestral.

Solución:

Se pueden tener 3C2 =3 muestras posibles. La tabla lista todas las muestras posibles de tamaño 2, con sus respectivas medias muestrales.

Muestras

Antigüedad

Media Muestral

A,B

(6,4)

5

A,C

(6,2)

4

B,C

(4,2)

3

La media poblacional es:

La media de la distribución muestral es:

La desviación estándar de la población es:

El error estándar o la desviación estándar de la distribución muestral es:

Si utilizamos la fórmula del error estándar sin el factor de correción tendriamos que:

Por lo que observamos que este valor no es el verdadero. Agregando el factor de corrección obtendremos el valor correcto:

El diagrama de flujo resume las decisiones que deben tomarse cuando se calcula el valor del error estándar:

Distribución Muestral de Medias

Si recordamos a la distribución normal, esta es una distribución continua, en forma de campana en donde la media, la mediana y la moda tienen un mismo valor y es simétrica.

Con esta distribución podíamos calcular la probabilidad de algún evento relacionado con la variable aleatoria, mediante la siguiente fórmula:

En donde z es una variable estandarizada con media igual a cero y varianza igual a uno. Con esta fórmula se pueden a hacer los cálculos de probabilidad para cualquier ejercicio, utilizando la tabla de la distribución z.

Sabemos que cuando se extraen muestras de tamaño mayor a 30 o bien de cualquier tamaño de una población normal, la distribución muestral de medias tiene un comportamiento aproximadamente normal, por lo que se puede utilizar la formula de la distribución normal con y , entonces la fórmula para calcular la probabilidad del comportamiento del estadístico, en este caso la media de la muestra , quedaría de la siguiente manera:

y para poblaciones finitas y muestro con reemplazo:

Ejemplo:

Una empresa eléctrica fabrica focos que tienen una duración que se distribuye aproximadamente en forma normal, con media de 800 horas y desviación estándar de 40 horas. Encuentre la probabilidad de que una muestra aleatoria de 16 focos tenga una vida promedio de menos de 775 horas.

Solución:

Este valor se busca en la tabla de z

La interpretación sería que la probabilidad de que la media de la muestra de 16 focos sea menor a 775 horas es de 0.0062.

Ejemplo:

Las estaturas de 1000 estudiantes están distribuidas aproximadamente en forma normal con una media de 174.5 centímetros y una desviación estándar de 6.9 centímetros. Si se extraen 200 muestras aleatorias de tamaño 25 sin reemplazo de esta población, determine:

  1. El número de las medias muestrales que caen entre 172.5 y 175.8 centímetros.
  2. El número de medias muestrales que caen por debajo de 172 centímetros.

Solución:

Como se puede observar en este ejercicio se cuenta con una población finita y un muestreo sin reemplazo, por lo que se tendrá que agregar el factor de corrección. Se procederá a calcular el denominador de Z para sólo sustituirlo en cada inciso.

 

(0.7607)(200)=152 medias muestrales

(0.0336)(200)= 7 medias muestrales

Distribución muestral de Proporciones

Existen ocasiones en las cuales no estamos interesados en la media de la muestra, sino que queremos investigar la proporción de artículos defectuosos o la proporción de alumnos reprobados en la muestra. La distribución muestral de proporciones es la adecuada para dar respuesta a estas situaciones. Esta distribución se genera de igual manera que la distribución muestral de medias, a excepción de que al extraer las muestras de la población se calcula el estadístico proporción (p=x/n en donde "x" es el número de éxitos u observaciones de interés y "n" el tamaño de la muestra) en lugar del estadísitico media.

Una población binomial está estrechamente relacionada con la distribución muestral de proporciones; una población binomial es una colección de éxitos y fracasos, mientras que una distribución muestral de proporciones contiene las posibilidades o proporciones de todos los números posibles de éxitos en un experimento binomial, y como consecuencia de esta relación, las afirmaciones probabilísticas referentes a la proporción muestral pueden evaluarse usando la aproximación normal a la binomial, siempre que np5 y
n(1-p)
5. Cualquier evento se puede convertir en una proporción si se divide el número obtenido entre el número de intentos.

Generación de la Distribución Muestral de Proporciones

Suponga que se cuenta con un lote de 12 piezas, el cual tiene 4 artículos defectuosos. Se van a seleccionar 5 artículos al azar de ese lote sin reemplazo. Genere la distribución muestral de proporciones para el número de piezas defectuosas.

Como se puede observar en este ejercicio la Proporción de artículos defectuosos de esta población es 4/12=1/3. Por lo que podemos decir que el 33% de las piezas de este lote están defectuosas.

El número posible de muestras de tamaño 5 a extraer de una población de 12 elementos es 12C5=792, las cuales se pueden desglosar de la siguiente manera:

Artículos Buenos

Artículos Malos

Proporción de artículos defectuoso

Número de maneras en las que se puede obtener la muestra

1

4

4/5=0.8

8C1*4C4=8

2

3

3/5=0.6

8C2*4C3=112

3

2

2/5=0.4

8C3*4C2=336

4

1

1/5=0.2

8C4*4C1=280

5

0

0/5=0

8C5*4C0=56

Total

792

Para calcular la media de la distribución muestral de proporciones se tendría que hacer la sumatoria de la frecuencia por el valor de la proporción muestral y dividirla entre el número total de muestras. Esto es:

Como podemos observar la media de la distribución muestral de proporciones es igual a la Proporción de la población.

p = P

También se puede calcular la desviación estándar de la distribución muestral de proporciones:

La varianza de la distribución binomial es 2= npq, por lo que la varianza de la distribución muestral de proporciones es 2p =(Pq)/n. Si se sustituten los valores en esta fórmula tenemos que:

, este valor no coincide con el de 0.1681, ya que nos falta agregar el factor de corrección para una población finita y un muestreo sin reemplazo:

La fórmula que se utilizará para el cálculo de probabilidad en una distribución muestral de proporciones está basada en la aproximación de la distribución normal a la binomial . Esta fórmula nos servirá para calcular la probabilidad del comportamiento de la proporción en la muestra.

A esta fórmula se le puede agregar el factor de corrección de si se cumple con las condiciones necesarias.

Ejemplo:

Se ha determinado que 60% de los estudiantes de una universidad grande fuman cigarrillos. Se toma una muestra aleatoria de 800 estudiantes. Calcule la probabilidad de que la proporción de la muestra de la gente que fuma cigarrillos sea menor que 0.55.

Solución:

Este ejercicio se puede solucionar por dos métodos. El primero puede ser con la aproximación de la distribución normal a la binomial y el segundo utilizando la fórmula de la distribución muestral de proporciones.

Aproximación de la distribución normal a la binomial:

Datos:

n=800 estudiantes

p=0.60

x= (.55)(800) = 440 estudiantes

p(x< 440) = ?

Media= np= (800)(0.60)= 480

p(x< 440) = 0.0017. Este valor significa que existe una probabilidad del 0.17% de que al extraer una muestra de 800 estudiantes, menos de 440 fuman cigarrillos.

 

Distribución Muestral de Proporciones

Datos:

n=800 estudiantes

P=0.60

p= 0.55

p(p< 0.55) = ?

Observe que este valor es igual al obtenido en el método de la aproximación de la distribución normal a la binomial, por lo que si lo buscamos en la tabla de "z" nos da la misma probabilidad de 0.0017. También se debe de tomar en cuenta que el factor de corrección de 0.5 se esta dividiendo entre el tamaño de la muestra, ya que estamos hablando de una proporción.

La interpretación en esta solución, estaría enfocada a la proporción de la muestra, por lo que diríamos que la probabilidad de que al extraer una muestra de 800 estudiantes de esa universidad, la proporción de estudiantes que fuman cigarrillos sea menor al 55% es del 0.17%.

Ejemplo:

Un medicamento para malestar estomacal tiene la advertencia de que algunos usuarios pueden presentar una reacción adversa a él, más aún, se piensa que alrededor del 3% de los usuarios tienen tal reacción. Si una muestra aleatoria de 150 personas con malestar estomacal usa el medicamento, encuentre la probabilidad de que la proporción de la muestra de los usuarios que realmente presentan una reacción adversa, exceda el 4%.

  1. Resolverlo mediante la aproximación de la normal a la binomial
  2. Resolverlo con la distribución muestral de proporciones

  1. Aproximación de la distribución normal a la binomial:
  2. Datos:

    n=150 personas

    p=0.03

    x= (0.04)(150) = 6 personas

    p(x>6) = ?

    Media = np= (150)(0.03)= 4.5

    p(x>6) = 0.1685. Este valor significa que existe una probabilidad del 17% de que al extraer una muestra de 150 personas, mas de 6 presentarán una reacción adversa.

  3. Distribución Muestral de Proporciones

Datos:

n=150 personas

P=0.03

p= 0.04

p(p>0.04) = ?

Observe que este valor es igual al obtenido y la interpretación es: existe una probabilidad del 17% de que al tomar una muestra de 150 personas se tenga una proporción mayor de 0.04 presentando una reacción adversa.

Ejemplo:

Se sabe que la verdadera proporción de los componentes defectuosos fabricadas por una firma es de 4%, y encuentre la probabilidad de que una muestra aleatoria de tamaño 60 tenga:

  1. Menos del 3% de los componentes defectuosos.
  2. Más del 1% pero menos del 5% de partes defectuosas.

Solución:

 

  1. Datos:
  2. n= 60 artículos

    P=0.04

    p= 0.03

    p(p<0.03) = ?

    La probabilidad de que en una muestra de 60 artículos exista una proporción menor de 0.03 artículos defectuosos es de 0.2327.

     

     

  3. Datos:

n= 60 artículos

P=0.04

p= 0.01 y 0.05

p(0.01<p<0.05) = ?