C) TRATAMIENTO PARA DATOS AGRUPADOS.
Cuando la muestra consta de
30 o más datos, lo aconsejable es agrupar los datos en clases y a partir de
estas determinar las características de la muestra y por consiguiente las de la
población de donde fue tomada.
Antes de pasar a definir
cuál es la manera de determinar las características de interés (media, mediana,
moda, etc.) cuando se han agrupado en clases los datos de la muestra, es
necesario que sepamos como se agrupan los datos.
Pasos para agrupar datos.
Rango = Valor
mayor – Valor menor
|
Tamaño de muestra o No. De datos |
Número de clases |
|
Menos de 50 |
5 a 7 |
|
50 a 99 |
6 a 10 |
|
100 a 250 |
7 a 12 |
|
250 en adelante |
10 a 20 |
El uso de esta tabla es uno
de los criterios que se puede tomar en cuenta para establecer el número de
clases en las que se van a agrupar los datos, existen otros para hacerlo.
![]()
d.
Formar
clases y agrupar datos.
Para formar la primera clase,
se pone como límite inferior de la primera clase un valor un poco menor que el
dato menor encontrado en la muestra y posteriormente se suma a este valor C,
obteniendo de esta manera el límite superior de la primera clase, luego se
procede a obtener los límites de la clase siguiente y así sucesivamente.
Ejemplo:
Los siguientes datos se
refieren al diámetro en pulgadas de un engrane.
|
6.75 |
7.00 |
7.00 |
6.75 |
6.50 |
6.50 |
7.15 |
7.00 |
|
6.50 |
6.50 |
6.50 |
6.25 |
6.25 |
6.50 |
6.65 |
7.00 |
|
7.25 |
6.70 |
6.00 |
6.75 |
6.00 |
6.75 |
6.75 |
7.10 |
|
7.00 |
6.70 |
6.50 |
6.75 |
6.25 |
6.65 |
6.75 |
7.10 |
|
7.25 |
6.75 |
6.25 |
6.25 |
7.00 |
6.75 |
7.00 |
7.15 |
a) Agrupe datos, considere
k=6.
b) Obtenga: Histograma, polígono
de frecuencias, ojiva y distribución de probabilidad.
c)
Obtenga:
media, mediana, moda y desviación estándar.
Solución:
a)
Agrupando
datos;
1. R= VM - Vm = 7.25 – 6.00 = 1.25
2.
k = 6
3.
4.Formando clases.
Para formar la primera clase se toma un
valor un poco menor que el valor menor encontrado en la muestra; luego,
|
LI LS |
Frecuencia |
Marca de clase |
Límite real inferior |
Límite real superior |
Frecuencia relativa |
Frecuencia Relativa acumulada |
|
5.97 – 6.18 |
2 |
6.075 |
5.965 |
6.185 |
2/40 = 0.05 |
0.05 |
|
6.19 – 6.40 |
5 |
6.295 |
6.185 |
6.405 |
5/40=0.125 |
0.175 |
|
6.41 – 6.62 |
7 |
6.515 |
6.405 |
6.625 |
0.175 |
0.350 |
|
6.63 – 6.84 |
13 |
6.735 |
6.625 |
6.845 |
0.325 |
0.675 |
|
6.85 – 7.06 |
7 |
6.955 |
6.845 |
7.065 |
0.175 |
0.850 |
|
7.07 – 7.28 |
6 |
7.175 |
7.065 |
7.285 |
0.15 |
1.000 |
|
Total |
40 |
|
|
|
1.000 |
|
b)
Gráficas:




a)
Media
(
).

![]()
=![]()
Donde:
k = número de clases
xi = marca de
clase i
fi = frecuencia
de la clase i
n =
número de datos en la muestra
b)
Mediana
(Xmed).

![]()
Donde:
Li = límite real inferior de
la clase que contiene a la mediana
Fme-1 = sumatoria
de las frecuencias anteriores a la clase en donde se encuentra la mediana
fme = frecuencia
de la clase en donde se encuentra la mediana
A = amplitud real de la
clase en donde se encuentra la mediana
A = LRS-LRI
LRS = límite real superior
de la clase que contiene a la mediana
LRI = límite real inferior
de la clase que contiene a la mediana
N = número de datos en la
muestra
f) Moda (Xmod).
![]()
![]()
Donde:
Li = límite real inferior de
la clase que contiene a la moda
d1 =
=![]()
d2 =
=![]()
fmo = frecuencia de la clase
que contiene a la moda
fmo-1= frecuencia de la
clase anterior a la que contiene a la moda
fmo+1= frecuencia de la
clase posterior a la que contiene a la moda
A = amplitud real de la
clase que contiene a la moda
A = LRS – LRI
LRS = límite real superior
de la clase que contiene a la moda
LRI = límite real inferior
de la clase que contiene a la moda
g) Desviación estándar (S).

![]()
=![]()
Donde:
xi = marca de
clase i
= media aritmética
fi = frecuencia
de la clase i
= número total de datos en la muestra