UNIDAD IV

PRUEBAS CHI-CUADRADA Y ESTADISTICA NO PARAMETRICA

Como ya se ha visto varias veces, los resultados obtenidos de muestras no siempre concuerdan exactamente con los resultados teóricos esperados, según las reglas de probabilidad. Por ejemplo, aunque consideraciones teóricas conduzcan a esperar 50 caras y 50 cruces cuando se lanza 100 veces una moneda bien hecha, es raro que se obtengan exactamente estos resultados.

Supóngase que en una determinada muestra se observan una serie de posibles sucesos E1, E2, E3, . . . , EK, que ocurren con frecuencias o1, o2, o3, . . ., oK, llamadas frecuencias observadas y que, según las reglas de probabilidad, se espera que ocurran con frecuencias e1, e2, e3, . . . ,eK llamadas frecuencias teóricas o esperadas.

A menudo se desea saber si las frecuencias observadas difieren significativamente de las frecuencias esperadas. Para el caso en que solamente son posibles dos sucesos E1 y E2 como, por ejemplo, caras o cruces, defectuoso, etc., el problema queda resuelto satisfactoriamente con los métodos de las unidades anteriores. En esta unidad se considera el problema general.

Definición de X2

Una medida de la discrepancia existente entre las frecuencias observadas y esperadas es suministrada por el estadístico X2, dado por:

donde si el total de frecuencias es N,

Si X2 = 0, las frecuencias observadas y esperadas concuerdan exactamente, mientras que si X2>0, no coinciden exactamente. A valores mayores de X2, mayores son las discrepancias entre las frecuencias observadas y esperadas.

Si las frecuencias esperadas son al menos iguales a 5, la aproximación mejora para valores superiores.

El número de grados de libertad está dado por:

= k – 1 – m

en donde:

K = número de clasificaciones en el problema.

m = número de parámetros estimados a partir de los datos muestrales para obtener los valores esperados.

Ensayo de Hipótesis

En la práctica, las frecuencias esperadas se calculan de acuerdo con la hipótesis Ho. Si bajo esta hipótesis el valor calculado de X2 dado es mayor que algún valor crítico, se deduce que las frecuencias observadas difieren significativamente de las esperadas y se rechaza Ho al nivel de significación correspondiente. En caso contrario, no se rechazará. Este procedimiento se llama ensayo o prueba de chi-cuadrado de la hipótesis.

Debe advertirse que en aquellas circunstancias en que X2 esté muy próxima a cero debe mirarse con cierto recelo, puesto que es raro que las frecuencias observadas concuerden demasiado bien con las esperadas. Para examinar tales situaciones, se puede determinar si el valor calculado de X2 es menor que las X2 críticas o de tabla (ensayo unilateral izquierdo), en cuyos casos se decide que la concordancia es bastante buena.

Ejemplos:

  1. La siguiente tabla muestra las frecuencias observadas al lanzar un dado 120 veces. Ensayar la hipótesis de que el dado está bien hecho al nivel de significación del 0.05.
  2. Cara

    1

    2

    3

    4

    5

    6

    Frecuencia Observada

    25

    17

    15

    23

    24

    16

    Solución:

    Ensayo de Hipótesis:

    Ho; Las frecuencias observadas y esperadas son significativamente iguales

    (dado bien hecho)

    H1; Las frecuencias observadas y esperadas son diferentes (dado cargado).

    Primero se procede a calcular los valores esperados. Como es bien sabido por todos la probabilidad de que caiga cualquier número en un dado no cargado es de 1/6. Como la suma de los valores observados es de 120, se multiplica este valor por 1/6 dando un resultado de 20 para cada clasificación.

    Cara

    1

    2

    3

    4

    5

    6

    Total

    Frecuencia Observada

    25

    17

    15

    23

    24

    16

    120

    Frecuencia esperada

    20

    20

    20

    20

    20

    20

     

    Grados de libertad = k-1-m = 6-1-0 = 5

    No se tuvo que calcular ningún parámetro para obtener las frecuencias esperadas.

    Regla de decisión:

    Si X2R 11.1 no se rechaza Ho.

    Si X2R >11.1 se rechaza Ho.

    Cálculos:

    Justificación y decisión:

    Como 5 es menor a 11.1 no se rechaza Ho y se concluye con una significación de 0.05 que el dado está bien hecho.

  3. En los experimentos de Mendel con guisantes, observó 315 lisos y amarillos, 108 lisos y verdes, 101 rugosos y amarillos y 32 rugosos y verdes. De acuerdo con su teoría, estos números deberían presentarse en la proporción 9:3:3:1. ¿Hay alguna evidencia que permita dudar de su teoría al nivel de significación del 0.01?
  4. Solución:

    Ensayo de Hipótesis:

    Ho; La teoría de Mendel es acertada.

    H1; La teoría de Mendel no es correcta.

    El número total de guisantes es 315+108+101+32=556. Puesto que los números esperados están el la proporción 9:3:3:1 (9+3+3+1=16), se esperaría:

    lisos y amarillos

    lisos y verdes

    rugosos y amarillos

    rugosos y verdes

    Grados de libertad = k-1-m = 4-1-0 = 3

    No se tuvo que calcular ningún parámetro para obtener las frecuencias esperadas.

    Regla de decisión:

    Si X2R 11.3 no se rechaza Ho.

    Si X2R >11.3 se rechaza Ho.

    Cálculos:

    Justificación y decisión:

    Como 0.470 es menor que 11.3 no se rechaza Ho y se concluye con un nivel de significación de 0.01 que la teoría de Mendel es correcta.

    Como el valor de 0.470 está cercano a cero, se procede a hacer un ensayo unilateral izquierdo:

    Ensayo de Hipótesis:

    Ho; La teoría de Mendel es acertada.

    H1; La teoría de Mendel es muy acertada.

    Regla de decisión:

    Si X2R 0.115 no se rechaza Ho.

    Si X2R < 0.115 se rechaza Ho.

    Como el valor de 0.470 no es menor a 0.115 se concluye que el experimento o la teoría de Mendel solo es buena.

  5. Una encuesta sobre 320 familias con 5 niños dio la distribución que aparece en la siguiente tabla. ¿Es el resultado consistente con la hipótesis de que el nacimiento de varón y hembra son igualmente posibles? Use = 0.05.
  6. Número de niños

    5

    4

    3

    2

    1

    0

    Número de niñas

    0

    1

    2

    3

    4

    5

    Número de familias

    18

    56

    110

    88

    40

    8

    Solución:

    Ensayo de hipótesis:

    H0; El nacimiento de niños y niñas es igualmente probable.

    H1; El nacimiento de niños y niñas no es igualmente probable.

    Este experimento tiene un comportamiento binomial, puesto que se tienen dos posibles resultados y la probabilidad de éxito se mantiene constante en todo el experimento.

    Se le llamará éxito al nacimiento de un varón o niño. Por lo que la variable aleatoria "x" tomará valores desde 0 hasta 5.

    Como se quiere ver si es igualmente probable el nacimiento de niños y niñas, la probabilidad de éxito será de 0.5.

    Utilizando la fórmula de la distribución binomial se calcularán las probabilidades, que multiplicadas por el número total de familias nos darán los valores esperados en cada clasificación.

    Recordando la fórmula de la distribución binomial:

    en donde n = 5 y "x" es el número de niños .

    Probabilidad de 5 niños y 0 niñas =

    Probabilidad de 4 niños y 1 niña =

    Probabilidad de 3 niños y 2 niñas =

    Probabilidad de 2 niños y 3 niñas =

    Probabilidad de 1 niño y 4 niñas =

    Probabilidad de 0 niños y 5 niñas =

    Si cada una de estas probabilidades se multiplican por 320 se obtienen los valores esperados:

    Número de niños

    5

    4

    3

    2

    1

    0

    Total

    Número de niñas

    0

    1

    2

    3

    4

    5

    Número de familias

    18

    56

    110

    88

    40

    8

    320

    Frecuencias esperadas

    10

    50

    100

    100

    50

    10

     

    Grados de libertad: k-1-m = 6-1-0 = 5

    Regla de decisión:

    Si X2R 11.1 no se rechaza Ho.

    Si X2R >11.1 se rechaza Ho.

    Cálculos:

    Justificación y decisión:

    Como el 12 es mayor a 11.1, se rechaza H0 y se concluye con un = 0.05 que el nacimiento de hombres y mujeres no es igualmente probable.

  7. Una urna contiene 6 bolas rojas y 3 blancas. Se extraen al azar dos bolas de la urna, se anota su color y se vuelven a la urna. Este proceso se repite un total de 120 veces y los resultados obtenidos se muestran en la siguiente tabla. Determinar al nivel de significación del 0.05 si los resultados obtenidos son consistentes con los esperados.

 

0

1

2

Bolas blancas

2

1

0

Número de extracciones

6

53

61

Solución:

Este experimento tiene las características de una distribución hipergeométrica, por lo cual se calcularán los valores esperados con el razonamiento de esta distribución.

Se llamara "x" a la variable aleatoria de interés que en este caso serán las bolas rojas. Por lo tanto "x" puede tomar valores desde 0 hasta 2.

La fórmula de la distribución hipergeométrica es:

Se tiene:

Probabilidad de extraer 0 rojas y 2 blancas:

Probabilidad de extraer 1 roja y 1 blanca:

Probabilidad de extraer 2 rojas y 0 blancas:

Con las probabilidades anteriores se obtendrán los valores esperados multiplicando por 120.

 

0

1

2

Bolas blancas

2

1

0

Número de extracciones

6

53

61

Frecuencias esperadas

10

60

50

Grados de libertad: k-1-m = 3-1-0 = 2

Regla de decisión:

Si X2R 5.991 no se rechaza Ho.

Si X2R >5.991 se rechaza Ho.

Cálculos:

Justificación y decisión:

Como el 4.83 no es mayor a 5.991, no se rechaza H0 y se concluye con un
= 0.05 que los resultados son los mismos que los esperados.