1.2 Tablas de doble entrada

Los ejercicios que vamos a realizar son muy sencillos y utilizan pocos datos, para aprender los conceptos no requerimos mayor cantidad, pues necesitaríamos mucho tiempo para realizar los cálculos.

Ahora bien, en la vida real, las estadísticas suelen recopilar los datos de muchas personas, pudiendo fácilmente superar el millar. En estos casos, representar la nube de puntos aislados puede ser una tarea compleja y de la que tampoco podemos sacar buenas conclusiones, además, si los datos se repiten debemos indicarlo en el diagrama de dispersión representándolos con un punto de distinto tamaño, de lo contrario el diagrama nos llevaría a error.

Por otra parte, si los datos recopilados son muy numerosos, al igual que se hace con las distribuciones univariantes, suelen agruparse en clases para poder trabajar más cómodamente con ellos.

Así, pues, las tablas que se utilizan normalmente suelen ser de "doble entrada", también llamadas de contingencia, que reúnen los valores de dos variables X e Y. En la cabecera de las filas y columnas se distribuyen los diferentes valores que pueden tomar las variables X e Y, y en cada celda que resulta de intersectar la fila i-ésima con la columna j-ésima se introduce la frecuencia nij (número de apariciones) de dicho suceso:

X \ Y y1
y2
... ...
ym
Σ
x1 n11
n12 ... ... n1m n1*
x2 n21 n22
... ... n2m
n2*
... ... ... ... ... ... ...
... ... ... ... ... ...
xk nk1
nk2 ... ... nkm nk*
Σ n*1
n*2 ... ... n*m n

donde: , y .

 

Ejemplo clásico de un diagrama de dispersión referido a una tabla de doble entrada es una ilustración del libro de Francis Galton con el que introdujo el concepto de regresión. En éste se puede apreciar cómo agrupa los datos de la población en función de la frecuencia asociada a cada pareja de valores.

 

 

Elaboración propia

 

 

 

 

Otra forma de representar las tablas de doble entrada consiste en utilizar diagramas tridimensionales, en el que las frecuencias vienen representadas por prismas o cilindros dispuestos sobre una base rectangular. Suelen utilizarse para elaborarlos programas específicos como las hojas de cálculo. En la imagen la representación de una distribución en la que se relacionan el número de horas de sueño de 60 alumnos con el número de suspensos que obtiene cada uno. Gráfico realizado con la hoja de cálculo EXCEL .