b) TRATAMIENTO PARA DATOS NO AGRUPADOS.
¿A qué se refiere esto? Cuando la muestra que se ha tomado de la población o proceso que se desea analizar, es decir, tenemos menos de 20 elementos en la muestra, entonces estos datos son analizados sin necesidad de formar clases con ellos y a esto es a lo que se le llama tratamiento de datos no agrupados.
b1. Medidas de tendencia
central. Se les llama medidas de
tendencia central a la media aritmética, la mediana, la media geométrica, la
moda, etc. debido a que al observar la distribución de los datos, estas tienden
a estar localizadas generalmente en su parte central. A continuación
definiremos algunas medidas de tendencia central y la forma de calcular su
valor.
1)
Media
aritmética (`x ). También se le conoce como promedio
ya que es el promedio de las lecturas o mediciones individuales que se tienen
en la muestra, se determina con la fórmula siguiente:

donde:
`x = media aritmética
xi = dato i
n = número de datos en la muestra
Ejemplos:
Solución:
![]()
![]()
![]()
![]()
2.
Se toman varias muestras de cierto tipo de queso y se
determina la cantidad de proteína por cada 100 gramos de queso, encontrándose
lo siguiente: 26.5 gramos, 24.8, 25.3, 30.5, 21.4, determine la cantidad promedio de proteína encontrada
en la muestra por cada 100 gramos de queso que se elabora.
Solución:
![]()
3.
Se hacen varias lecturas de una muestra que
contiene cobre, las lecturas se hacen en un espectrofotómetro de absorción
atómica y son la siguientes: 12.3%, 12.28, 12.27, 12.3, 12.24, 15.01, determine
la concentración promedio de Cu en la muestra.
Solución:
![]()
Si observamos las
lecturas del espectrofotómetro nos damos cuenta que el valor de 15.01% es un
valor diferente al de las lecturas anteriores, por lo que se descarta el valor
ya que se considera un valor atípico, es decir un valor que es debido a
circunstancias especiales, en este caso puede ser que se deba al hecho de que
se está descalibrando el aparato de absorción atómica o simplemente que se ha
equivocado el operador del aparato al tomar la lectura, por lo que la media se
debe calcular con las primeras cinco lecturas; como se muestra a continuación:
Solución:
![]()
![]()
y esta sería la
media correcta
![]()
4. Si deseamos determinar la edad promedio de los
estudiantes de una escuela de nivel superior al iniciar sus estudios, suponga
que se toman las edades de algunos de los alumnos de cierta clase y estas son
las que siguen: 20, 18, 18, 19, 18, 19, 35, 20, 18, 18, 19.
Solución:
Luego, la media se determinará con solo 10 de las edades ya
que es necesario descartar la edad de 35 años, que es un dato atípico o un caso
especial, por lo que;
![]()
![]()
![]()
Nota: Cuando es necesario determinar
aquellas medidas de tendencia central que hagan uso de todos los datos de la
muestra se recomienda descartar todos aquellos datos atípicos que se encuentren
en la muestra o muestras tomadas.
2)
Media
geométrica (G). Es la raíz en enésima del producto de los valores de los elementos de la muestra, es usada cuando
los valores de los datos de la muestra
no son lineales, es decir que su valor depende de varios factores a la vez, se
determina de la siguiente forma:
![]()
Donde:
G = media geométrica
xi = dato i
n = número de datos en la muestra
Ejemplos:
1. Las siguientes temperaturas han sido tomadas de un proceso químico, 13.4oC, 12.8, 11.9, 13.6, determine la temperatura promedio de este proceso.
Solución:
G =
= 12.9077 oC
2. Las siguientes temperaturas han sido tomadas de un proceso para fabricar queso chihuahua, 21.4oC, 23.1, 20.2, 19.7, 21.0, determine la temperatura promedio de este proceso.
Solución:
G =
= 21.048 oC
3) Media aritmética
ponderada ( xw ). Esta media
se usa cuando el peso que tiene cada uno de los datos de la muestra es
diferente, se calcula de la siguiente manera:

donde:
xw = media
aritmética ponderada
xi = dato i
wi = peso del
dato i
Ejemplo:
A continuación se mencionan
las materias que Luis Pérez llevó en el primer semestre de Ingeniería Química,
el número de créditos y la calificación obtenida;
|
MATERIA |
NUMERO CREDITOS |
CALIFICACIÓN |
|
Metodología de la investigación |
8 |
90.5 |
|
Matemáticas I |
10 |
100.0 |
|
Programación |
8 |
81.0 |
|
Química |
10 |
78.0 |
|
Dibujo |
4 |
100.0 |
|
Economía |
8 |
84.0 |
Determine la calificación promedio que obtuvo Luis Pérez en su
primer semestre.
Solución:
=
![]()
Nota: Sí comparamos este
promedio con el que se obtiene usando simplemente la media aritmética, que es
un 88.91, nos damos cuenta de que este último es mayor, por no tomar en cuenta
el peso o número de créditos que aporta cada materia a la carrera que se
estudia, el promedio de esta persona es menor al de la media aritmética debido
a que obtiene una calificación baja es Química que es una de las materias que
aporta más créditos.
4)
Media
armónica (H). La media armónica se define como el recíproco del promedio de los
recíprocos de cada uno de los datos que se tienen en la muestra, y
se determina de la siguiente manera:

Ejemplo: Determine la media
armónica de los siguientes datos, 3.1, 2.8, 2.84, 3.05, 3.09
Solución:
![]()
![]()
5)
Mediana (xmed). La mediana es aquel valor
que se encuentra en la parte central de los datos que se tienen en la muestra una
vez que estos han sido ordenados según su valor o magnitud. Para calcular la
mediana se presentan dos casos:
a.
Cuando
el número de datos en la muestra es impar.- En este caso después de ordenar los
datos de la muestra en cuanto a su magnitud, es decir de mayor a menor valor o
de menor a mayor valor, se procede a localizar aquel dato que se encuentra
justo en el centro de los datos o en la parte
central de los mismos, el valor de este dato será el que dé valor a la
mediana.
Ejemplo:
Los siguientes datos son las mediciones obtenidas de un circuito utilizado en un arnés de lavadora; se toman como muestra siete circuitos y sus mediciones son: 11.3, 11.2, 11.5, 11.2, 11.2, 11.4, 11.5 cm.
Solución:
Ordenando los datos de menor
a mayor valor;
11.2, 11.2, 11.2, 11.3,
11.4, 11.5, 11.5
Se observa que el dato 11.3 es el que queda en la parte central,
por lo que este es el que dará valor a la mediana; entonces,
xmed = 11.3 cm.
b.
Cuando
el número de datos en la muestra es par.- En este caso después de ordenar los
datos en cuanto a su magnitud, observamos que en la parte central de los datos
no se encuentra dato alguno, en este caso, la mediana tomará el valor del
promedio de dos datos; el que se encuentra antes de la parte central y el que
se encuentra después de la parte central.
Ejemplo:
Los siguientes datos son las mediciones obtenidas de un circuito utilizado en un arnés de lavadora; se toman como muestra ocho circuitos y sus mediciones son: 11.3, 11.2, 11.5, 11.2, 11.2, 11.4, 11.5, 11.4 cm.
Solución:
Ordenando los datos de mayor a menor valor,
11.5, 11.4, 11.4, 11.3, 11.2, 11.2, 11.2, 11,1 cm.
Se observa que en la parte central de los datos no hay dato alguno por lo que la mediana se determina con el promedio de los datos subrayados, entonces,
![]()
![]()
Nota: Es imprescindible para calcular el valor de la mediana el que primero se ordenen los datos en cuanto a su magnitud, ya que de no hacerlo, se incurriría en un grave error.
5) Moda (xmod). La moda se define como aquel valor o valores que más se repiten o que tienen mayor frecuencia entre los datos que se han obtenido en una muestra, la muestra de una población nos genera la distribución de los datos una vez que estos se han graficado y en esta gráfica es posible observar la moda o modas de la misma, es por esto que una distribución de datos puede ser amodal (carece de moda), unimodal (tiene una sola moda), bimodal (tiene dos modas) o polimodal (tiene más de dos modas).
Ejemplos:
1. Determine la moda de los datos que se muestran a continuación, se refieren a la estatura de un grupo de jóvenes; 1.60m, 1.65, 1.70, 1.71, 1.70, 1.70, 1.70, 1.71, 1.70, 1.93, 1.87, 1.85
Solución:
|
Estatura |
Frecuencia |
|
1.60 |
1 |
|
1.65 |
1 |
|
1.70 |
5* |
|
1.71 |
2 |
|
1.85 |
1 |
|
1.87 |
1 |
|
1.93 |
1 |
La tabla muestra la
distribución de frecuencias de los datos o el número de veces que estos se
repiten, la mayor frecuencia que es 5 corresponde a una estatura de 1.70m, por
lo que esta sería la moda.
Luego, xmod
= 1.70m
2.
Determine
la moda de los siguientes datos que se refieren a la edad de alumnos de primer
semestre del tecnológico de Chihuahua, 18 años, 17, 19, 21, 19, 18, 22, 22, 18,
18, 17, 19, 19, 19, 18, 20, 21, 20, 18, 19, 18, 19, 18,19, 22, 35
Solución:
|
Edad |
Frecuencia |
|
17 |
2 |
|
18 |
7* |
|
19 |
8* |
|
20 |
2 |
|
21 |
2 |
|
22 |
3 |
|
35 |
1 |
En este caso se observa que
las edades que más frecuencia tienen son las de 18 y 19 años, por lo que se
concluye que existen dos modas,
Xmod1=
18 años , Xmod2= 19años
Hay que hacer notar que la
frecuencia para ambas modas puede ser de igual magnitud o diferente, como en el
caso que se ilustra.
b2. Medidas de Dispersión. Cuando
se tiene una muestra de datos obtenida de una población cualquiera, es
importante determinar sus medidas de tendencia central así como también es
básico el determinar que tan dispersos están los datos en la muestra, por lo
que se hace necesario determinar su rango, la varianza, la desviación estándar,
etc., ya que una excesiva variabilidad o dispersión en los datos indica la
inestabilidad del proceso en análisis en la mayoría de los casos.
1)
Rango
o recorrido. El rango es la diferencia entre el valor mayor y el valor menor
encontrados en la muestra, también se le denomina recorrido ya que nos dice
entre que valores hace su recorrido la variable de interés; y se determina de
la siguiente manera:
R = VM
– Vm
Donde:
R = rango o
recorrido
VM =
valor mayor en la muestra
Vm =
valor menor en la muestra
Ejemplo:
1. Se han tomado como muestras las mediciones de la resistencia a la tensión de la soldadura usada para unir dos cables, estas son: 78.5kg, 82.4, 87.3, 78.0, 90.0, 86.5, 77.9, 92.4, 75.9, determine su rango o recorrido.
Solución:
VM = 92.4 kg
Vm = 75.9 kg
R
= VM – Vm = 92.4 – 75.9 = 16.5 kg
2. Se toman las mediciones de la cantidad de grasa de la leche en gramos por cada 100 ml de leche que entra a un proceso de pasteurización, a continuación se enumeran; 14.85, 15.32, 12.76, 16.29, 15.84, 17.3, 17.61, 16.33, determine el rango o recorrido de la cantidad de grasa de la leche.
Solución:
VM = 17.61
Vm = 12.76
R = 17.61 – 12.76 = 4.85gramos
2) Desviación
absoluta media (
). Esta medida de dispersión nos representa la diferencia
absoluta promedio que existe entre cada dato que se encuentra en la muestra y
la media de los datos y se determina de la siguiente manera:

Donde:
xi = dato i
= media aritmética de la muestra
n = número de datos en la muestra
Ejemplo:
1. Determine la desviación absoluta media de los siguientes datos que son las concentraciones de plomo de algunas muestras, las que a continuación se enumeran: 18gr, 12, 21, 19, 16, 20, 22
Solución:
Para determinar la desviación absoluta media o promedio, lo primero que hay que hacer es calcular la media aritmética de los datos de la muestra, la que es 128/7 =18.286, luego se procede a calcular el promedio de las diferencias absolutas entre cada dato y la media calculada.

![]()
La interpretación de este resultado sería que el grado de alejamiento absoluto promedio de los datos con respecto a su media es de 2.5305 gramos.
¿Por qué sacar el valor absoluto de las diferencias entre cada dato y la media aritmética? Si solo se hicieran diferencias entre cada dato y la media aritmética, estas tendrían signos positivos y negativos ya que algunos datos son menores que la media y otros son mayores que la media, luego al sumar las diferencias, con sus signos correspondientes, éstas se irían anulando unas con otras y no sería posible medir leal grado de alejamiento promedio de los datos en la muestra.
3) Varianza o variancia (s2). Es el promedio
de las diferencias elevadas al cuadrado entre cada valor que se tiene en la
muestra (xi) y la media aritmética (
) de los datos y se determina de la siguiente manera:

Donde n es el número de datos en la muestra.
Ejemplo:
Los siguientes datos es la cantidad de glucosa en miligramos encontrada en muestras de sangre de algunos pacientes, 14.2, 12.1, 15.6, 18.1, 14.3, determine su varianza.
Solución:
Lo primero que hay que calcular es la media aritmética de la muestra como ya se ha hecho anteriormente.
![]()

![]()
Nota:
Dentro de la inferencia estadística se
plantea la deferencia entre una variancia muestral s2 y una
poblacional, representada por s2.
4)
Desviación
estándar (s). Es la desviación o diferencia promedio que existe entre cada dato
de la muestra y la media aritmética de la muestra. Y se obtiene a partir de la
varianza, sacándole raíz cuadrada.
![]()
donde:
s2= varianza o variancia
Por tanto la desviación estándar de la
muestra anterior sería;
s = ![]()
La interpretación de este resultado sería, que
la cantidad de glucosa encontrada en la muestra es en promedio de 14.86 miligramos
y que la cantidad de glucosa en la muestra se aleja o dispersa en promedio 1.9704 mg alrededor de la media.
En este caso solo nos interesa conocer el
significado de la desviación estándar, aunque es necesario decir que s es la
desviación de la muestra y que s es la desviación de la población, así como s2
es la varianza de la muestra y s2 es la varianza de la población.