viernes, 1 de noviembre de 2019

Data Science: Regresión Logística: Introducción

Vamos a ver qué es una Regresión Logística:

Una regresión logística es igual que una regresión lineal pero se utiliza para predecir variables categóricas en lugar de para variables continuas.
Es decir, si queremos predecir, por ejemplo, si una persona es hombre o mujer dependiendo de ciertas variables, utilizamos una regresión logística en lugar de una lineal.

Diferencias entre regresiones lineales y logísticas:



Vamos a ver una pequeña introducción en código.

Cargamos las librerías y abrimos el dataset de ventas. Este dataset lo único que tiene es el género de una persona y si ha comprado un determinado producto, es decir dos variables categóricas:


Creamos la tabla de contingencia, es decir, el número de registros del dataset que encajan en cada combinación de valores entre las dos variables:


Obtenemos la proporción de compras o no compras para los dos sexos:


Utilizamos la probabilidad condicionada para calcular un par de casos concretos de ejemplo:


Calculamos las probabilidades más útiles para el par de variables que tenemos:


Calculamos el ratio de probabilidades de compra para cada sexo:



Y el ratio global para comprobar qué sexo compra más:


Por último, mostramos las fórmulas de la regresión lineal y las regresiones logísticas:



Y eso es todo de momento.

No hay comentarios:

Publicar un comentario