3.1. Parámetros estadísticos de centralización.
|
Cuando trabajamos con una serie, grande, de valores numéricos y queremos hacer un resumen de ellos, la media tiene gran importancia porque sirve como una buena representación del conjunto de valores. Luego veremos algunas propiedades que apoyan esta afirmación. |
Se representa por
y es el valor que se obtiene de sumar todos los valores de la variable
estadística y dividisrlo entre el número total de observaciones.
La fórmula que nos permite su cáculo es:
Si los datos están agrupados, cada uno de ellos con una frecuencia fi la fórmula sería:
Las calificaciones obtenidas por un grupo de 200 alumnos en la asignatura de Matemáticas se recogen en la siguiente tabla
| Calificación | 1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
| Nº de Alumnos |
10 | 10 |
20 |
25 |
40 |
45 |
15 |
20 |
15 |
La Medía es:
La Mediana
Una vez ordenados los valores de la variable estadística de menor a mayor, el valor central es la mediana.
Si el número de valores de la variable es par (y por lo tanto no existe un valor que esté en el medio) la mediana es el promedio de los dos valores centrales.
Es el valor de la variable que deja, tanto por debajo como por encima, a la mitad de los valores.
Las calificaciones obtenidas por un grupo de 200 alumnos en la asignatura de Matemáticas se recogen en la siguiente tabla:
| Calificación | 1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
| Nº de Alumnos |
10 | 10 |
20 |
25 |
40 |
45 |
15 |
20 |
15 |
Para calcular la mediana, ordenamos los datos construyendo la tabla de frecuancias acumuladas
| Calificación | 1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
| Nº de Alumnos |
10 | 20 |
40 |
105 |
40 |
150 |
165 |
185 |
200 |
Como la variable tiene tiene 200 valores, la mediana es el promedio de los valoires que ocupan los lugares 100 y 101, es decir 5 (ambos son 5)
donde:
Li es el extremo inferior de la clase donde se encuentra la mediana.
a es la amplitud del intervalo donde se encuentra la mediana.
n es el número total de datos.
Fi-1 es la frecuencia absoluta acumulada de la clase anterior a la clase de la mediana.
fi es la frecuencia absoluta de la clase mediana.
Se ha tomado una muestra de 75 bombillas y se ha medido las horas que han funcionado hasta averiarse y se ha obtenido la siguiente tabla de datos:
| Duración (horas) |
250-300 | 300-350 |
350-400 |
400-450 |
450-500 |
500-550 |
| Nº de bombillas |
3 | 6 |
21 | 28 | 11 |
6 |
La variable "duración" es una variable continua, por ello hemos agrupado los datos en intervalos. Los intervalos se han tomado de una amplitud de 50 horas para todos.
Moda: la Moda de la variable duración es 425 horas que es la marca de la clase (400,450)
Media:
Mediana: Construimos la tabla de las frecuencias acumuladas
| Duración | 250-300 | 300-350 |
350-400 |
400-450 |
450-500 |
500-550 |
| Nº de bombillas |
3 | 9 |
30 |
58 |
69 | 75 |
La clase que contiene a la mediana es 400-450, aplicando la fómula que vimos anteriormente, obtenemos
Es el valor de la variable que más se repite.
Es el valor de la variable estadística que tiene mayor frecuencia.
Una variable estadística puede tener más de una moda, si tiene dos modas diremos que la distribución es bimodal, trimodal si tiene tres y así sucesivamente.
Las calificaciones obtenidas por un grupo de 200 alumnos en la asignatura de Matemáticas se recogen en la siguiente tabla
| Calificación | 1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
| Nº de Alumnos |
10 | 10 |
20 |
25 |
40 |
45 |
15 |
20 |
15 |
La Moda es 6, ques la nota que han obtenido mas alumnos (45)
En el siguiente applet te presentamos las notas de 30 alumnos de una clase, en ella hemos hecho una representación de estos datos mediante barras y hemos calculado la Medía, Mediana y Moda de la clase.
Varia los valores de la tabla y verás como cambian los valores calculados.
En una clase de 30 alumnos se observa el número de suspensos que ha habido en la primera evaluación y se obtiene los fatos de la siguiente tabla:
| Nº Suspensos | 0 | 1 |
2 |
3 |
4 |
5 |
| Nº alumnos |
2 | 4 |
6 |
10 |
5 |
3 |