| Imprimir | INSTITUTO TECNOLOGICO DE CHIHUAHUA | << Contenido >> |
UNIDAD III
TEORIA DE PEQUEÑAS MUESTRAS O TEORIA EXACTA DEL MUESTREO
En las unidades anteriores se manejó el uso de la distribución z, la cual se podía utilizar siempre y cuando los tamaños de las muestras fueran mayores o iguales a 30 ó en muestras más pequeñas si la distribución o las distribuciones de donde proviene la muestra o las muestras son normales.
En esta unidad se podrán utilizar muestras pequeñas siempre y cuando la distribución de donde proviene la muestra tenga un comportamiento normal. Esta es una condición para utilizar las tres distribuciones que se manejarán en esta unidad; t de student, X2 ji-cuadrada y Fisher.
A la teoría de pequeñas muestras también se le llama teoría exacta del muestreo, ya que también la podemos utilizar con muestras aleatorias de tamaño grande.
En esta unidad se verá un nuevo concepto necesario para poder utilizar a las tres distribuciones mencionadas. Este concepto es "grados de libertad".
Para definir grados de libertad se hará referencia a la varianza muestral:

Esta fórmula está basada en n-1 grados de libertad (degrees of freedom). Esta terminología resulta del hecho de que si bien s2 está basada en n cantidades
. . . ,
éstas suman cero, así que especificar los valores de cualquier n-1 de las cantidades determina el valor restante. Por ejemplo, si n=4 y
;
y
, entonces automáticamente tenemos
, así que sólo tres de los cuatro valores de
están libremen
te determinamos 3 grados de libertad.
Entonces, en esta unidad la fórmula de grados de libertad será n-1 y su simbología ![]()
Supóngase que se toma una muestra de una población normal con media
es una distribución normal estándar. Supóngase que la varianza de la población La media y la varianza de la distribución t son
La siguiente figura presenta la gráfica de varias distribuciones t. La apariencia general de la distribución t es similar a la de la distribución normal estándar: ambas son simétricas y unimodales, y el valor máximo de la ordenada se alcanza en la media

Propiedades de las distribuciones t
La distribución de la variable aleatoria t está dada por:

Esta se conoce como la distribución t con
Sean X1, X2, . . . , Xn variables aleatorias independientes que son todas normales con media
tiene una distribución t con La distribución de probabilidad de t se publicó por primera vez en 1908 en un artículo de W. S. Gosset. En esa época, Gosset era empleado de una cervecería irlandesa que desaprobaba la publicación de investigaciones de sus empleados. Para evadir esta prohibición, publicó su trabajo en secreto bajo el nombre de "Student". En consecuencia, la distribución t normalmente se llama distribución t de Student, o simplemente distribución t. Para derivar la ecuación de esta distribución, Gosset supone que las muestras se seleccionan de una población normal. Aunque esto parecería una suposición muy restrictiva, se puede mostrar que las poblaciones no normales que poseen distribuciones en forma casi de campana aún proporcionan valores de t que se aproximan muy de cerca a la distribución t.
La distribución t difiere de la de Z en que la varianza de t depende del tamaño de la muestra y siempre es mayor a uno. Unicamente cuando el tamaño de la muestra tiende a infinito las dos distribuciones serán las mismas.
Se acostumbra representar con
Para encontrar los valores de t se utilizará la tabla de valores críticos de la distribución t del libro Probabilidad y Estadística para Ingenieros de los autores Walpole, Myers y Myers.
Ejemplo:
El valor t con
t0.975=-t0.025 = -2.145

Si se observa la tabla, el área sombreada de la curva es de la cola derecha, es por esto que se tiene que hacer la resta de
Ejemplo:
Encuentre la probabilidad de –t0.025 < t < t0.05.
Solución:

Como t0.05 deja un área de 0.05 a la derecha, y –t0.025 deja un área de 0.025 a la izquierda, encontramos un área total de 1-0.05-0.025 = 0.925.
P( –t0.025 < t < t0.05) = 0.925
Ejemplo:
Encuentre k tal que P(k < t < -1.761) = 0.045, para una muestra aleatoria de tamaño 15 que se selecciona de una distribución normal.
Solución:

Si se busca en la tabla el valor de t =1.761 con 14 grados de libertad nos damos cuenta que a este valor le corresponde un área de 0.05 a la izquierda, por ser negativo el valor. Entonces si se resta 0.05 y 0.045 se tiene un valor de 0.005, que equivale a
P(-2.977 < t < -1.761) = 0.045
Ejemplo:
Un ingeniero químico afirma que el rendimiento medio de la población de cierto proceso en lotes es 500 gramos por milímetro de materia prima. Para verificar esta afirmación toma una muestra de 25 lotes cada mes. Si el valor de t calculado cae entre –t0.05 y t0.05, queda satisfecho con su afirmación. ¿Qué conclusión extraería de una muestra que tiene una media de 518 gramos por milímetro y una desviación estándar de 40 gramos? Suponga que la distribución de rendimientos es aproximadamente normal.
Solución:
De la tabla encontramos que t0.05 para 24 grados de libertad es de 1.711. Por tanto, el fabricante queda satisfecho con esta afirmación si una muestra de 25 lotes rinde un valor t entre –1.711 y 1.711.
Se procede a calcular el valor de t:

Este es un valor muy por arriba de 1.711. Si se desea obtener la probabilidad de obtener un valor de t con 24 grados de libertad igual o mayor a 2.25 se busca en la tabla y es aproximadamente de 0.02. De aquí que es probable que el fabricante concluya que el proceso produce un mejor producto del que piensa.
INTERVALO DE CONFIANZA PARA
; CON
DESCONOCIDA
Si
y s son la media y la desviación estándar de una muestra aleatoria de una población normal con varianza

donde
Se hace una distinción entre los casos de
Con mucha frecuencia los estadísticos recomiendan que aun cuando la normalidad no se pueda suponer, con

Por lo general éste se denomina como un intervalo de confianza de muestra grande. La justificación yace sólo en la presunción de que con una muestra grande como 30, s estará muy cerca de la
Ejemplos:
Solución:
La media muestral y la desviación estándar para los datos dados son:
10 y s= 0.283
En la tabla se encuentra que t0.025=2.447 con 6 grados de libertad, de aquí, el intervalo de confianza de 95% para
![]()

Con un nivel de confianza del 95% se sabe que el promedio del contenido de los contenedores está entre 9.47 y 10.26 litros.
9.85 9.93 9.75 9.77 9.67
9.87 9.67 9.94 9.85 9.75
9.83 9.92 9.74 9.99 9.88
9.95 9.95 9.93 9.92 9.89
Se desea encontrar un nivel de confianza del 95% para el tiempo de combustión residual promedio. Supóngase que el tiempo de combustión residual sigue una distribución normal.
Solución:
La media muestral y la desviación estándar para los datos dados son:
9.8525 y s= 0.0965
En la tabla se encuentra que t0.025=2.093 con 19 grados de libertad, de aquí, el intervalo de confianza de 95% para


Por lo tanto, se tiene una confianza del 95% de que el tiempo de combustión residual promedio se encuentra entre 9.8073 y 9.8977 segundos.
PRUEBA DE HIPOTESIS SOBRE LA MEDIA DE UNA DISTRIBUCION NORMAL, VARIANZA DESCONOCIDA
Ciertamente sospechamos que las pruebas sobre una media poblacional
con
desconocida, debe incluir el uso de la distribución t de Student. La estructura de la prueba es idéntica a la del caso de
conocida, con la excepción de que el valor
en la estadística de prueba se reemplaza por la estimación de s calculada y la distribución normal estándar se reemplaza con una distribución t.
Ejemplos:
Solución:
![]()
s= 11.9 kilowatt-hora
= 42 kilowatt-hora
n = 12
![]()
Ho;
H1;

Si tR
Si tR < -1.796 Se rechaza Ho

Como –1.16 > -1.796, por lo tanto no se rechaza Ho y se concluye con un nivel de significancia del 0.05 que el número promedio de kilowwatt-hora que gastan al año las aspiradoras no es significativamente menor que 46.
Solución por el otro método:

Regla de decisión:
Si ![]()
Si
< 39.83 Se rechaza Ho
Como la
= 42 y este valor no es menor que 39.83 por lo tanto no se rechaza Ho.
Se puede aprovechar este ejemplo para calcular el valor de P , como el valor de t calculada es de –1.16, se busca en la tabla y se ve que el area a la izquierda de este valor es de 0.135 con 11 grados de libertad, por lo tanto no se rechaza Ho., ya que sería un valor alto para un nivel de significancia.

|
19.8 |
18.5 |
17.6 |
16.7 |
15.8 |
|
15.4 |
14.1 |
13.6 |
11.9 |
11.4 |
|
11.4 |
8.8 |
7.5 |
15.4 |
15.4 |
|
19.5 |
14.9 |
12.7 |
11.9 |
11.4 |
|
10.1 |
7.9 |
¿Sugieren los datos que la carga promedio de falla es mayor que 10Mpa? Supóngase que la carga donde se presenta la falla tiene una distribución normal, y utilicese
Solución:
![]()
s = 3.55
= 13.71
n = 22
![]()
Ho;
H1;

Si tR
Si tR> 1.721 se rechaza Ho.

Como 4.90 >1.721 se rechaza Ho y se concluye con un nivel de significancia del 0.05 que la carga de falla promedio es mayor que 10Mpa.
Existe otra manera de resolver este ejercicio, tomando la decisión en base al estadístico real, en este caso la media de la muestra. De la fórmula de la distribución muestral de medias se despeja la media de la muestra:
![]()

Regla de decisión:
Si ![]()
Si
> 11.30 Se rechaza Ho
Como la media de la muestral es de 13.71 MPa y es mayor al valor de la media muestral límite de 11.30 por lo tanto se rechaza Ho y se llega a la misma conclusión.
Para calcular el valor de P se va a la tabla y se busca en 21 grados de libertad el valor de t = 4.90. Se obseva que el valor mayor de t que se encuentra en la tabla con 21 grados de libertad es de 3.819 el cual le corresponde un área a la derecha de 0.0005, por lo que para el valor de 4.90 el valor de P es practicamente cero, y esto apoya la decisión de rechazar Ho.
Solución:
![]()
s = 1.21 libras
= 14.3 libras
n = 8
![]()
Ho;
H1;

Si –2.365
Si tR < -2.365 ó si tR > 2.365 Se rechaza Ho

Como
Solución por el otro método:
12.98 y 15.01

Regla de decisión:
Si 12.98
Si
< 12.98 ó
> 15.01 se rechaza Ho
Como la
= 14.3 libras, entonces no se rechaza Ho .
Para calcular el valor de P se busca en la tabla el valor de 0.7012 con 7 grados de libertad. Se obseva que este valor no se encuentra pero se puede interpolar entre los valores de 0.549 y 0.896 con áreas de 0.30 y 0.20 respectivamente. Interpolando linealmente se obtiene el valor de 0.2561.

Error tipo II ó
El error tipo II se calcula de la misma forma en la que se calculó con la distribución z. Se realizarán algunos ejercicios en los cuales se determinará la probabilidad de cometer el error tipo II, utilizando la tabla de la distribución.
Existen curvas características de operación en los libros con diferentes grados de libertad para determinar los tamaños de muestra correspondientes según el grado de error que se quiera, recordando que entre mayor sea el tamaño de muestra menor será el error.
Solución:
![]()
s= 0.21 volts
= 1.4 volts.
n = 15
![]()
Ho;
H1;

Si tR
Si tR < -2.624 Se rechaza Ho

Como –1.84 > -2.624, por lo tanto no se rechaza Ho y se concluye con un nivel de significancia del 0.01 que los voltajes de las pilas tamaño C no son menores a 1.5.
Para calcular el error tipo II se tiene que obtener el valor de
de la siguiente forma:


Para encontrar el valor de
Solución:
Primero se calculan los valores de
:


En este último cálculo para
Se busca en la tabla el valor de 3.55 con 7 grados de libertad, y al interpolar nos da un área de 0.00475. El área correspondiente a 1.19 con 7 grados de libertad es de 0.1479. Por lo que
Solución:
Primero se obtendrá el valor del estadístico límite:


| Imprimir | INSTITUTO TECNOLOGICO DE CHIHUAHUA | << Contenido >> |