DISTRIBUCION "F" FISHER

La necesidad de disponer de métodos estadísticos para comparar las varianzas de dos poblaciones es evidente a partir del análisis de una sola población. Frecuentemente se desea comparar la precisión de un instrumento de medición con la de otro, la estabilidad de un proceso de manufactura con la de otro o hasta la forma en que varía el procedimiento para calificar de un profesor universitario con la de otro.

Intuitivamente, podríamos comparar las varianzas de dos poblaciones, y , utilizando la razón de las varianzas muestrales s21/s22. Si s21/s22 es casi igual a 1, se tendrá poca evidencia para indicar que y no son iguales. Por otra parte, un valor muy grande o muy pequeño para s21/s22, proporcionará evidencia de una diferencia en las varianzas de las poblaciones.

La variable aleatoria F se define como el cociente de dos variables aleatorias ji-cuadrada independientes, cada una dividida entre sus respectivos grados de libertad. Esto es,

donde U y V son variables aleatorias ji-cuadrada independientes con grados de libertad 1 y 2 respectivamente.

Sean U y V dos variables aleatorias independientes que tienen distribución ji cuadradas con grados de libertad, respectivamente. Entonces la distribución de la variable aleatoria está dada por:

y se dice que sigue la distribución F con grados de libertad en el numerador y grados de libertad en el denominador.

La media y la varianza de la distribución F son:

para

para

 

La variable aleatoria F es no negativa, y la distribución tiene un sesgo hacia la derecha. La distribución F tiene una apariencia muy similar a la distribución ji-cuadrada; sin embargo, se encuentra centrada respecto a 1, y los dos parámetros proporcionan una flexibilidad adicional con respecto a la forma de la distribución.

Si s12 y s22 son las varianzas muestrales independientes de tamaño n1 y n2 tomadas de poblaciones normales con varianzas 12 y 22, respectivamente, entonces:

Para manejar las tablas de Fisher del libro de Introducción a la Inferencia Estadística del autor Güenther, se tendrá que buscar primero los grados de libertad dos para luego localizar el área correspondiente, relacionándola con los grados de libertad uno, para calcular el valor de F.

Las tablas tienen la siguiente estructura:

P

1 2 3 ……. ….. 500 …

6

0.0005

 
 

0.001

 
 

0.005

 
 

.

 
 

.

 
 

0.9995

30.4

El valor de 30.4 es el correspondiente a una Fisher que tiene 3 grados de libertad uno y 6 grados de libertad dos con un área de cero a Fisher de 0.995. Si lo vemos graficamente:

Como nos podemos imaginar existen varias curvas Fisher, ya que ahora su forma depende de dos variables que son los grados de libertad.

 

 

Ejemplos :

  1. Encontrar el valor de F, en cada uno de los siguientes casos:

  1. El área a la derecha de F, es de 0.25 con =4 y =9.
  2. El área a la izquierda de F, es de 0.95 con =15 y =10.
  3. El área a la derecha de F es de 0.95 con con =6 y =8.
  4. El área a la izquierda de F, es de 0.10 con con =24 y
=24

Solución:

  1. Como el área que da la tabla es de cero a Fisher, se tiene que localizar primero los grados de libertad dos que son 9, luego un área de 0.75 con 4 grados de libertad uno.
  2. En este caso se puede buscar el área de 0.95 directamente en la tabla con sus respectivos grados de libertad.
  3. Se tiene que buscar en la tabla un área de 0.05, puesto que nos piden un área a la derecha de F de 0.95.
  4. Se busca directamente el área de 0.10, con sus respectivos grados de libertad.

  1. Si s12 y s22 son las varianzas muestrales de muestras aleatorias independientes de tamaños n1=10 y n2 =20, tomadas de poblaciones normales que tienen las mismas varianzas, encuentre P(s12/s22 2.42).
  2. Solución:

    Primero se establecen los grados de libertad. Como en el numerador está la población uno y en el denominador la población dos, entonces los grados de libertad uno equivalen a 10-1=9 y los grados de libertad dos a 20-1=19.

    Se procede a ir a la tabla a buscar los grados de libertad dos que son 19 y se observa que no están, por lo tanto se tiene que interpolar entre 15 y 20 grados de libertad, buscando el valor de fisher que quedaría:

    Este valor de 2.42 se busca en la columna de 9 grados de libertad uno, con 15 grados de libertad dos, y se encuentra los siguiente:

    Area

    0.90

    2.09

    0.95

    2.59

    Al interpolar entre estos dos valores nos queda un área de 0.933.

    Se procede a hacer lo mismo pero con 20 grados de libertad dos:

    Area

    0.95

    2.39

    0.975

    2.84

    Al interpolar entre estos dos valores nos queda un área de 0.9516.

    Ahora ya se tienen las dos áreas referentes a los grados de libertad dos, por lo que se interpolará para ver cuánto le corresponde a los grados libertad dos con un valor de 19.

    Area

    15

    0.933

    20

    0.9516

    Al interpolar nos queda que para 9 grados de libertad uno y 19 grados de libertad dos con un valor de Fisher de 2.42 el área a la izquierda es de 0.9478.

  3. Si s12 y s22 representan las varianzas de las muestras aleatorias independientes de tamaño n1= 25 y n2 = 31, tomadas de poblaciones normales con varianzas 12 =10 y
22 = 15, respectivamente, encuentre P(s12/s22 > 1.26).

Solución:

Calcular el valor de Fisher:

Luego se va a la tabla de Fisher a buscar 30 grados de libertad 2 con 24 grados de libertad uno. Cuando se este en esta posición se busca adentro de la tabla el valor de Fisher de 1.89. Al localizarlo y ver a la izquierda de este valor se obtiene un área de 0.95, pero esta área correspondería a la probabilidad de que las relaciones de varianzas muestrales fueran menor a 1.26, por lo que se calcula su complemento que sería 0.05, siendo esta la probabilidad de que s12/s22 > 1.26.

Intervalo de Confianza para el Cociente de Varianzas de Dos Distribuciones Normales

Supóngase que se tienen dos poblaciones normales e independientes con varianzas desconocidas 12 y 22, respectivamente. De este par de poblaciones, se tienen disponibles dos muestras aleatorias de tamaños n1 y n2, respectivamente, sean s12 y s22 las dos varianzas muestrales. Se desea conocer un intervalo de confianza del 100() por ciento para el cociente de las dos varianzas, 12/22.

Para construir el intervalo de confianza para el cociente de dos varianzas poblacionales, se coloca la varianza muestral mayor en el numerador del estadístico F.

Ejemplos:

  1. Un fabricante de automóviles pone a prueba dos nuevos métodos de ensamblaje de motores respecto al tiempo en minutos. Los resultados se muestran el la tabla:
  2. Método 1

    Método 2

    n1 = 31

    n2 = 25

    s12 = 50

    s22 = 24

    Construya un intervalo de confianza del 90% para 12/22.

    Solución:

    Por la recomendación de que la varianza muestral mayor va en el numerador se tiene la siguiente fórmula:

    al despejar:.

    F toma dos valores dependiendo del nivel de confianza y de los grados de libertad. En este caso los grados de libertad uno valen 30 y los grados de libertad dos 24.

    y

    Estos resultados los podemos interpretar de la siguiente manera:

    Con un nivel de confianza del 90% se sabe que la relación de varianzas 12/22 esta entre 1.07 y 3.93. Esto supondría que la varianza de la población 1 es mayor a la varianza de la población 2 entre 1.07 y 3.93.

  3. Una compañía fabrica propulsores para uso en motores de turbina. Al ingeniero de manufactura le gustaría seleccionar el proceso que tenga la menor variabilidad en la rugosidad de la superficie. Para ello toma una muestra de n1=16 partes del primer proceso, la cual tiene una desviación estándar s1 = 4.7 micropulgadas, y una muestra aleatoria de n2=12 partes del segundo proceso, la cual tiene una desviación estándar s2 = 5.1 micropulgadas. Se desea encontrar un intervalo de confianza del 90% para el cociente de las dos varianzas 12/
22. Suponga que los dos procesos son independientes y que la rugosidad de la superficie está distribuida de manera normal.

Solución:

Por la recomendación de que la varianza muestral mayor va en el numerador se tiene la siguiente fórmula:

al despejar:.

En este caso los grados de libertad uno valen 11 y los grados de libertad dos 15.

y

Estos resultados los podemos interpretar de la siguiente manera:

Puesto que este intervalo de confianza incluye a la unidad, no es posible afirmar que las desviaciones estándar de la rugosidad de la superficie de los dos procesos sean diferentes con un nivel de confianza del 90%.

 

Ensayo de Hipótesis

Supóngase que se tiene interés en dos poblaciones normales independientes, donde las medias y las varianzas de la población son desconocidas. Se desea probar la igualdad de las dos varianzas, ya que para poder comparar las medias de estas dos poblaciones se utiliza la distribución t de Student, en la cual podemos tener varianzas iguales o diferentes en la población.

Para conocer esto último se requiere de la distribución Fisher, y después de utilizarla, se tomará la decisión de tener o no varianzas iguales en la población, dando pié a realizar la comparación de las dos medias según estemos hablando. Primer caso en que las varianzas de la población son desconocidas pero iguales, o en el caso dos donde se tienen varianzas desconocidas pero disímiles.

Para el ensayo de hipótesis se utilizará la relación de varianzas, la cual puede dar tres resultados:

En base a lo que se quiera probar, el ensayo podrá ser unilateral derecho, izquierdo o bilateral.

Ejemplos:

  1. La variabilidad en la cantidad de impurezas presentes en un lote de productos químicos, utilizada para un proceso en particular, depende del tiempo que tarda el proceso. Un fabricante que emplea dos líneas de producción 1 y 2, hizo un pequeño ajuste al proceso 2, con la esperanza de reducir la variabilidad, así como la cantidad media de impurezas en los productos químicos. Muestras de n1=25 y n2=20 mediciones de dos lotes produjeron las siguientes medias y varianzas:

¿Presentan los datos evidencia suficiente para indicar que las variaciones del proceso son menores para el 2? Realice una prueba con un = 0.05.

 

Solución:

Datos:

Población 1 Población 2

n1 = 25 n2 = 20

= 0.05

Ensayo de hipótesis:

Estadístico de prueba:

La sugerencia que se hace es que el numerador sea el de valor mayor .

Entonces los grados de libertad uno será el tamaño de la muestra de la población uno menos uno. 1= 25-1 = 24 y 2 = 20-1=19.

 

 

 

 

Regla de decisión:

Si Fc 2.11 No se rechaza Ho,

Si la Fc > 2.11 se rechaza Ho.

Cálculo:

Decisión y Justificación:

Como 2.04 es menor que 2.11 no se rechaza Ho, y se concluye con un = 0.05 que no existe suficiente evidencia para decir que la varianza del proceso 2 es menor que la del proceso 1.

 

  1. En su incansable búsqueda de un sistema de llenado adecuado, cierta empresa prueba dos máquinas. Robo-fill se usa para llenar 16 tarros y da una desviación estándar de 1.9 onzas en el llenado. Con Automat-fill se llenan 21 frascos que dan una desviación estándar de 2.1 onzas. Si la empresa tiene que elegir uno de estos sistemas en función de la uniformidad de llenado. ¿Cual deberá seleccionar? Use un
= 0.10.

Solución:

Datos:

Robo-Fill

sRF = 1.9

nRF = 16

= 0.10

Automat-Fill

sAF = 2.1

nAF = 21

 

Ensayo de hipótesis:

Estadístico de prueba:

La sugerencia que se hace es que el numerador sea el de valor mayor .

Entonces los grados de libertad uno será el tamaño de la muestra de la población uno menos uno. 1= 21-1 = 20 y 2 = 16-1=15.

Regla de decisión:

Si Fc 2.20 No se rechaza Ho,

Si la Fc > 2.20 se rechaza Ho.

Cálculo:

Decisión y Justificación:

Como 1.22 es menor que 2.20 no se rechaza Ho, y se concluye con un = 0.10 que la variación de llenado de la máquina Robo-Fill no es menor a la de Automat-Fill, por lo que se selecciona cualquier máquina.

  1. Las capas de óxido en las obleas semiconductoras son depositadas en una mezcla de gases para alcanzar el espesor apropiado. La variabilidad del espesor es una característica crítica de la oblea, y lo deseable para los siguientes pasos de la fabricación es tener una variabilidad baja. Para ello se estudian dos mezclas diferentes de gases con la finalidad de determinar con cuál se obtienen mejores resultados en cuanto a la reducción en la variabilidad del espesor del óxido. Veintiún obleas son depositadas en cada gas. Las desviaciones estándar de cada muestra del espesor del óxido son s1 = 1.96 angstroms y s2 = 2.13 angstroms. ¿Existe evidencia que indique una diferencia en las desviaciones? Utilice
=0.05.

Solución:

Datos:

s1= 1.96

n1 = 21

s2 = 2.13

n2= 21

Ensayo de hipótesis:

Estadístico de prueba:

La sugerencia que se hace es que el numerador sea el de valor mayor .

Entonces los grados de libertad uno será el tamaño de la muestra de la población uno menos uno. 1= 21-1 = 20 y 2 = 21-1=20.

Regla de decisión:

Si 0.406 Fc 2.46 No se rechaza Ho,

Si la Fc < 0.406 ó si Fc > 2.46 se rechaza Ho.

Cálculo:

Decisión y Justificación:

Como 0.85 esta entre los dos valores de Ho no se rechaza , y se concluye con un = 0.05 que existe suficiente evidencia para decir que las varianza de las poblaciones son iguales.

Error Tipo II ó

  1. Para el ejercicio anterior, encontrar la probabilidad de cometer error tipo II si la verdadera relación 12/
22 = 2.

 

Solución:

 

 

 

 

 

  1. Del ejercicio número 1 del ensayo de hipótesis en donde la variabilidad en la cantidad de impurezas presentes en un lote de productos químicos dependía del tiempo que tardaba el proceso y el fabricante empleaba dos líneas de producción 1 y 2, e hizo un pequeño ajuste al proceso 2, calcular la probabilidad de cometer error tipo II si le relación 12/
22 = 1.5.

Solución:

por lo tanto s12/s22 = 2.11 ya que esto fue lo que dio la tabla y al despejar nos queda los mismo. Se calcula un nuevo valor de F con la relación de varianzas de 1.5.

Si se recuerda para este ejercicio se tienen 24 grados de libertad uno y 19 de grados de libertad dos, por lo que se tiene que hacer una doble interpolación ya que 19 grados de libertad dos no vienen en la tabla.

Primero se interpolará para 24 grados de libertad uno y 15 grados de libertad dos:

Area

Valor de F

0.50

1.02

0.75

1.41

Al interpolar para un valor de Fisher de 1.406 se ve que este valor está muy cercano a 1.41, el cual le corresponde un área de 0.75, por lo que queda un resultado de 0.7474

Ahora se procede a interpolar para 24 grados de libertad uno y 20 grados de libertad dos:

Area

Valor de F

0.75

1.35

0.90

1.77

La interpolación para un valor de Fisher de 1.406 es de 0.77.

Teniendo los dos valores, se puede calcular el área correspondiente a 24 grados de libertad uno y 19 grados de libertad dos:

2

Area

15

0.7474

20

0.77

Por lo tanto al interpolar para 19 grados de libertad dos nos da un valor de 0.76548