El coeficiente de correlación lineal, se conoce también como correlación de Pearson, se trata de una medida estadística que realiza el cálculo entre dos variables, mientras que estas sean cuantitativas y continuas, además es uno de los que más se usa para hacer el cálculo de las relaciones lineales.
Es una medida que se utiliza ampliamente en estadística y tiene la finalidad de cuantificar la dependencia lineal entre dos variables que sean diferentes. Señala el conjunto de variables y las representa en puntos de manera favorable o desfavorable al aproximarse a una recta.
Si estás comenzando en estadística, probablemente aprenderá primero sobre la R de Pearson. De hecho, cuando alguien se refiere a la coeficiente de correlación, por lo general se habla de Pearson.
Contenidos de este artículo
Ejemplos
La correlación de Pearson se utiliza en miles de situaciones de la vida real.
Ejemplo 1
Por ejemplo, los científicos de China querían saber si existía una relación entre las diferencias genéticas entre las poblaciones de arroz con malas hierbas. El objetivo era conocer el potencial evolutivo del arroz. Se analizó la correlación de Pearson entre los dos grupos.
Mostró una correlación positiva del momento del producto de Pearson de entre 0,783 y 0,895 para las poblaciones de arroz maleza. Esta cifra es bastante alta, lo que sugiere una relación bastante fuerte.
Ejemplo 2
Otro ejemplo para entender la investigación correlacional puede ser un investigador científico está estudiando la correlación entre el cáncer y estar casado. En ese estudio hay dos variables: el casamiento y el cáncer.
Podríamos decir que el matrimonio o estar casado tiene una negativa asociación con esta enfermedad. Esto puede significar que las personas que están en un matrimonio tienen menos probabilidades de desarrollar la enfermedad. Sin embargo, también significa directamente que estar casado evite directamente la enfermedad.
En la investigación correlacional, no es posible establecer la causa de qué causa qué. Es un error pensar que un estudio correlacional involucra dos variables cuantitativas. Sin embargo, la realidad es que se miden dos variables, pero ninguna se cambia. Esto es cierto independientemente de que las variables sean cuantitativas o categóricas.
Por lo general, en estadística, medimos cuatro tipos de correlaciones:
- Correlación de Pearson
- Correlación de rango de Kendall
- Correlación de Spearman
- Correlación punto-biserial.
Sociedades del coeficiente de correlación lineal
El coeficiente de correlación de Pearson indica la sociedad que tienen dos variables cuando se encuentran entre sí, estas sociedades son:
- Correlación mayor a cero: Este caso indica que es positiva, por lo tanto, las variables se correlacionan de forma directa. Si el valor de una variable es alto, la otra también lo es, cuando son bajos ocurre lo mismo.
- Correlación menor a cero: En este caso la correlación es negativa, lo que significa que las variables se relacionan de forma inversa. Si el valor de una de las variables es alto, el de la otra variable es bajo.
- Correlación igual a cero: En el caso de que sea igual a cero indica que no se puede determinar la variación. A pesar de esto, no indica que no haya una relación lineal entre las variables. Si las variables son independientes, es un indicativo que están correlacionadas.
Para que se pueda realizar esta correlación, se debe cumplir lo siguiente:
- Las variables deben ser distribuidas de manera conjunta.
- En los datos no deben existir valores diferentes.
- La escala de medida tiene que ser una escala de intervalo o relación.
- La relación tiene que ser lineal.
En esta correlación lineal se pueden mencionar las siguientes ventajas principales:
- La exactitud de la estimación es más probable cuando la muestra es grande.
- El valor de cualquier unidad es independiente cuando se usa para medir las variables.
Comparación de coeficientes de Pearson y Spearman
La diferencia fundamental entre los dos coeficientes de correlación es que el coeficiente de Pearson funciona con una relación lineal entre las dos variables, mientras que el coeficiente de Spearman también funciona con relaciones monótonas.
Una diferencia más es que Pearson trabaja con valores de datos brutos de las variables, mientras que Spearman trabaja con variables ordenadas por rango.
Ahora, si creemos que un diagrama de dispersión indica visualmente una relación “podría ser monótona, podría ser lineal”, nuestra mejor opción sería aplicar Spearman y no Pearson. No se haría ningún daño al cambiar a Spearman incluso si los datos resultaran ser perfectamente lineales. Pero, si no es exactamente lineal y usamos el coeficiente de Pearson, perderemos la información que podría capturar Spearman.
Ejemplos de coeficiente de correlación lineal
- El coeficiente de correlación lineal se refiere a la medida estadística que evalúa y cuantifica la dependencia lineal entre dos variables.
- También conocido como correlación de Pearson, realiza la medición de regresión con la capacidad de medir el grado de variación entre dos variables al mismo tiempo.
- Al no asociar las dos variables continuamente entre los elementos no es lineal, lo que indica que el coeficiente no estará representado de manera adecuada.
- La diferencia fundamental entre el coeficiente de correlación lineal o de Pearson funciona con una relación lineal entre las dos variables, mientras que el coeficiente de Spearman también funciona con relaciones monótonas.