Análisis de regresión y correlación (primera parte)

Introducción

Muchas veces las decisiones se basan en la relación entre dos o más variables. Ejemplos:

Distinguiremos entre relaciones funcionales y relaciones estadísticas.

Relación funcional entre dos variables

Una relación funcional se expresa mediante una función matemática.

Si X es la variable independiente e Y es la variable dependiente, una relación funcional tiene la forma:

Y = f(X)

Ejemplo nº 1

Datos para el cálculo
ParcelaDosisRendimiento (kg/h)
1
2
3
75
25
130
150
50
260

Gráfica de la relación funcional perfecta entre dosis y rendimientos
Figura 1: Relación funcional perfecta entre dosis y rendimientos

• Nota: Las observaciones caen exactamente sobre la línea de relación funcional

Relación estadística entre dos variables

A diferencia de la relación funcional, no es una relación perfecta, las observaciones no caen exactamente sobre la curva de relación entre las variables

Ejemplo nº 2

Datos para el cálculo
Lote de productosTamaño del loteHoras hombre
1
2
3
4
5
30
20
60
80
40
73
50
128
170
87

Gráfica de la relación estadística entre tamaño del lote y horas hombre
Figura 2: Relación estadística entre tamaño del lote y horas hombre

• Nota: La mayor parte de los punto no caen directamente sobre la línea de relación estadística.

Esta dispersión de punto alrededor de la línea representa la variación aleatoria.

Gráfica de una relación estadística es de tipo curvilínea
Figura 3: Coordenadas de puntos de control utilizados para corregir la columna de los niveles digitales de una imagen satelital

• Nota: se trata de un terreno rugoso donde varían notablemente las condiciones de observación del sensor, para corregir errores geométricos de la imagen, se aplican funciones de segundo grado. Los datos sugieren que la relación estadística es de tipo curvilínea.

Conceptos básicos

Análisis de Regresión: Es un procedimiento estadístico que estudia la relación funcional entre variables. Con el objeto de predecir una en función de la/s otra/s.

Análisis de Correlación: Un grupo de técnicas estadísticas usadas para medir la intensidad de la relación entre dos variables

Diagrama de Dispersión: Es un gráfico que muestra la intensidad y el sentido de la relación entre dos variables de interés.

Variable dependiente (respuesta, predicha, endógena): es la variable que se desea predecir o estimar

Variables independientes (predictoras, explicativas exógenas). Son las variables que proveen las bases para estimar.

Regresión simple: interviene una sola variable independiente

Regresión múltiple: intervienen dos o más variables independientes.

Regresión lineal: La función es una combinación lineal de los parámetros.

Regresión no lineal: La función que relaciona los parámetros no es una combinación lineal

Gráfico de dispersión

Los diagramas de dispersión no sólo muestran la relación existente entre variables, sino también resaltan las observaciones individuales que se desvían de la relación general. Estas observaciones son conocidas como outliers o valores inusitados, que son puntos de los datos que aparecen separados del resto.

Gráfico de dispersión entre bandas
Gráfico de dispersión entre bandas

Coeficiente de correlación lineal

El Coeficiente de Correlación (r) requiere variables medidas en escala de intervalos o de proporciones

Gráfico de una correlación negativa perfecta
Gráfico de una correlación negativa perfecta

Gráfico de una correlación positiva perfecta
Gráfico de una correlación positiva perfecta

Gráfico de ausencia de correlación
Ausencia de correlación

Gráfico de una correlación fuerte y positiva
Correlación fuerte y positiva

Fórmula para el coeficente de correlación (r) Pearson:

r =n·(∑X·Y) - (∑X)·(∑Y)
[n·(∑X²) - (∑X)²]·[n·(∑Y²) - (∑Y)²]

Modelos de Regresión

Un modelo de regresión, es una manera de expresar dos ingredientes esenciales de una relación estadística:

Estas dos características están implícitas en un modelo de regresión, postulando que:

Representación gráfica del modelo de regresión lineal
Representación gráfica del modelo de regresión lineal

• Nota: en esta figura se muestran las distribuciones de probabilidades de Y para distintos valores de X

Editor: Ricardo Santiago Netto (Administrador de Fisicanet).

Coeficiente de correlación lineal. Modelos de Regresión. ¿Qué es la correlación y regresión?

Éste sitio web usa cookies, si permanece aquí acepta su uso.
Puede leer más sobre el uso de cookies en nuestra política de privacidad.