Tema 2: Estadística bidimensional

En la vida diaria observamos muchos fenómenos que dependen de dos o más variables que, en general, suelen estar relacionadas entre sí. Esta relación puede ser de tipo funcional o estadística. En la relación funcional el valor de una variable determina completamente el de la otra, mientras que en la relación estadística los valores que toma una variable están más libres, sólo el conjunto de valores responde a una determinada ley.

Píldoras. Wikimedia (Dominio Público)

Los ejemplos pueden ser muy variados. En general, cuanto más alta es una persona su peso también aumenta. Pero no es un factor determinante, una persona menos alta que otra puede pesar más que aquélla. No obstante, si representamos los datos de una cantidad apreciable de personas notaremos que hay una cierta correspondencia o correlación entre unos y otros valores.

También debemos tener en cuenta que hay otros factores que incidirán en los resultados, es claro que las mujeres y los niños o adolescentes pesan menos (en general) que los hombres. Por ello no se deben mezclar datos con diferentes características.

Las estadisticas son fundamentales en muchos campos de la investigación, desde la medicina, economía, agricultura, transporte, ingeniería, etc. Con ellas podemos entender e interpretar la relación o influencia que tienen unas determinadas variables sobre otras. Pero se debe ser muy cauto en la forma de llevar a cabo una investigación y, sobre todo, en las conclusiones que se puedan sacar de ella. Ver si un determinado fármaco es o no mejor que otro exige estudiar los resultados obtenidos con grupos de control en los que se prueben uno u otro medicamento.

La correlación y regresión entre variables es un campo muy profundo que requiere gran cuidado en la investigación, pues no es nada fácil determinar la causalidad en la dependencia entre variables. En este tema nos centraremos exclusivamente en la correlación y regresión lineal, que nos servirá para entender, con ejemplos sencillos, cómo se aplican las técnicas estadísticas en algunos casos, y también nos prevendrá sobre posibles generalizaciones sin fundamento que pueden ser falsas.