C)   TRATAMIENTO PARA DATOS AGRUPADOS.

 

Cuando la muestra consta de 30 o más datos, lo aconsejable es agrupar los datos en clases y a partir de estas determinar las características de la muestra y por consiguiente las de la población de donde fue tomada.

Antes de pasar a definir cuál es la manera de determinar las características de interés (media, mediana, moda, etc.) cuando se han agrupado en clases los datos de la muestra, es necesario que sepamos como se agrupan los datos.

 

Pasos para agrupar datos.

  1. Determinar el rango o recorrido de los datos.

 

Rango = Valor mayor – Valor menor

 

  1. Establecer el número de clases (k)en que se van a agrupar los datos tomando como base para esto la siguiente tabla.

 

 

 

 

Tamaño de muestra o No. De datos

Número de clases

Menos de 50

5 a 7

50 a 99

6 a 10

100 a 250

7 a 12

250 en adelante

10 a 20

 

El uso de esta tabla es uno de los criterios que se puede tomar en cuenta para establecer el número de clases en las que se van a agrupar los datos, existen otros para hacerlo.

 

  1. Determinar la amplitud de clase para agrupar (C).

 

 

 

 

d.      Formar clases y agrupar datos.

Para formar la primera clase, se pone como límite inferior de la primera clase un valor un poco menor que el dato menor encontrado en la muestra y posteriormente se suma a este valor C, obteniendo de esta manera el límite superior de la primera clase, luego se procede a obtener los límites de la clase siguiente y así sucesivamente.

 

Ejemplo:

Los siguientes datos se refieren al diámetro en pulgadas de un engrane.

 

6.75

7.00

7.00

6.75

6.50

6.50

7.15

7.00

6.50

6.50

6.50

6.25

6.25

6.50

6.65

7.00

7.25

6.70

6.00

6.75

6.00

6.75

6.75

7.10

7.00

6.70

6.50

6.75

6.25

6.65

6.75

7.10

7.25

6.75

6.25

6.25

7.00

6.75

7.00

7.15

 

a) Agrupe datos, considere k=6.

b) Obtenga: Histograma, polígono de frecuencias, ojiva y distribución de probabilidad.

c)      Obtenga: media, mediana, moda y desviación estándar.

Solución:

a)      Agrupando datos;

 

1.      R= VM - Vm = 7.25 – 6.00 = 1.25

            2.     k = 6

            3.     

           4.Formando clases.

 

Para formar la primera clase se toma un valor un poco menor que el valor menor encontrado en la muestra; luego,

 

 

 

LI         LS

Frecuencia

Marca de clase

Límite real inferior

Límite real superior

Frecuencia relativa

Frecuencia Relativa acumulada

5.97 – 6.18

2

6.075

5.965

6.185

2/40 = 0.05

0.05

6.19 – 6.40

5

6.295

6.185

6.405

5/40=0.125

0.175

6.41 – 6.62

7

6.515

6.405

6.625

0.175

0.350

6.63 – 6.84

13

6.735

6.625

6.845

0.325

0.675

6.85 – 7.06

7

6.955

6.845

7.065

0.175

0.850

7.07 – 7.28

6

7.175

7.065

7.285

0.15

1.000

Total

40

 

 

 

1.000

 

 

 

b)      Gráficas:

 

 

 

 

 

 

a)      Media ().

 

 

=

 

Donde:

k = número de clases

xi = marca de clase i

fi = frecuencia de la clase i

n = número de datos en la muestra

 

b)      Mediana (Xmed).

 

 

                  

 

Donde:

Li = límite real inferior de la clase que contiene a la mediana

Fme-1 = sumatoria de las frecuencias anteriores a la clase en donde se encuentra la mediana

fme = frecuencia de la clase en donde se encuentra la mediana

A = amplitud real de la clase en donde se encuentra la mediana

A = LRS-LRI

LRS = límite real superior de la clase que contiene a la mediana

LRI = límite real inferior de la clase que contiene a la mediana

N = número de datos en la muestra

 

f)   Moda (Xmod).

 

 

 

Donde:

Li = límite real inferior de la clase que contiene a la moda

d1 = =

d2 = =

fmo = frecuencia de la clase que contiene a la moda

fmo-1= frecuencia de la clase anterior a la que contiene a la moda

fmo+1= frecuencia de la clase posterior a la que contiene a la moda

A = amplitud real de la clase que contiene a la moda

A = LRS – LRI

LRS = límite real superior de la clase que contiene a la moda

LRI = límite real inferior de la clase que contiene a la moda

 

 

g)   Desviación estándar (S).

 

                        

                           

                   =

 

Donde:

xi = marca de clase i

= media aritmética

fi = frecuencia de la clase i

                  = número total de datos en la muestra