Qué es la regresión lineal múltiple?
La regresión lineal múltiple, comúnmente conocida como regresión múltiple, es una de las formas más comunes de análisis de regresión. Es una medida estadística que utiliza diversas variables explicativas (independientes) para anticipar el efecto de una variable de respuesta (dependiente). En palabras sencillas, es una herramienta de análisis predictivo que explica la relación entre una variable dependiente continua y dos o más variables independientes (múltiples).
Supuestos de la regresión lineal múltiple
En estadística, por lo general, todos los modelos tienen algunos supuestos subyacentes. Del mismo modo, el modelo de regresión múltiple funciona con algunos supuestos. Algunos de ellos son los siguientes:
Las variables independientes no tienen una correlación demasiado alta entre sí.
Debe existir una relación lineal entre las dos variables, i.e. variables dependientes e independientes.
Los residuos de la regresión deben tener una distribución normal con una media de 0 y una varianza.
Los residuos deben ser homocedásticos.
Qué se puede concluir de la regresión lineal múltiple?
-
La regresión lineal múltiple es una forma de regresión en la que la variable dependiente muestra una relación lineal con otras variables independientes. Las variables independientes pueden ser dos o más. La regresión lineal múltiple también puede ser no lineal. En ese caso, las dos variables, dependiente e independiente, no siguen una línea recta.
-
Ambos tipos de regresión múltiple, la lineal y la no lineal, rastrean una respuesta específica utilizando múltiples (dos o más) variables gráficamente. Aunque ambos trazan lo mismo, la regresión no lineal es un poco difícil de ejecutar. Los supuestos para la regresión no lineal múltiple suelen ser derivaciones del método de prueba y error.
-
La regresión lineal simple ayuda a predecir el valor de una variable utilizando el valor identificado de otra variable. A diferencia de éste, el modelo de regresión múltiple se centra en varias variables explicativas.
La fórmula de la regresión lineal múltiple
yi = β0 + β1?i1 + β2?i2 +…+ βp?ip + ϵ
donde,
i = n observaciones
yi = variable dependiente
β0 = intersección y
β1 y β2 = coeficientes de regresión que dan el cambio en y relativo a una alteración de una sola unidad en xi1 y xi2.
βp = coeficientes de pendiente de las variables explicativas (independientes).
xi1 y xi2 = variables explicativas
ϵ = término de error del modelo (también conocido como residuos)