jueves, 24 de octubre de 2019

Data Science: Regresión Lineal Múltiple

Siguiendo con la entrada de la regresión lineal, vamos a ver cómo hacer una regresión lineal múltiple (que haya dos o más variables predictoras):

Siguiendo con la entrada anterior, donde hacíamos una regresión lineal para las ventas en función de la variable TV, vamos a hacer otra regresión lineal, pero esta vez teniendo en cuenta las variables TV y Periódicos.

Primero hacemos la regresión lineal en sí:


Luego mostramos los parámetros de la ecuación y sus p valores:


Obtenemos los estadísticos R cuadrado y realizamos una predicción de la columna de ventas en función de las de TV y periódicos:


Calculamos los diferentes errores:


Como se puede comprobar, comparando éste modelo de regresión lineal con el anterior, en éste baja un porcentaje muy pequeño el error de estimación, por lo que quizás la variable de periódicos no sea muy útil para nuestro modelo.

Por último, mostramos un resumen del modelo:


Podemos comprobar que el modelo mejora un poco, pero no lo suficiente como para considerar la variable de periódicos un buen predictor de ventas.

Vamos a hacer un nuevo modelo de regresión, pero esta vez con las variables de televisión y radio.

Calculamos el modelo y mostramos sus propiedades:


A simple vista se puede apreciar que el modelo mejora muchísimo, así que la combinación de TV y radio son muy buenos predictores de ventas.

Calculamos los diferentes errores:


Se puede comprobar que el error promedio de estimación baja muchísimo, hasta casi la mitad que cuando utilizamos sólo la variable de TV.

Y eso es todo.

No hay comentarios:

Publicar un comentario