Mostrando entradas con la etiqueta Estadística. Mostrar todas las entradas
Mostrando entradas con la etiqueta Estadística. Mostrar todas las entradas

lunes, 16 de diciembre de 2019

Data Science: Análisis de los Componentes Principales

Cuando tenemos un dataset con muchas variables, se hace necesario un método para reducir el número de variables a tener en cuenta a las más significativas. Para eso se utiliza el ACP:

domingo, 1 de diciembre de 2019

jueves, 28 de noviembre de 2019

Data Science: Árboles y Bosques Aleatorios








Data Science: Árboles y Bosques Aleatorios - Árboles de Regresión

Los árboles de regresión son iguales que los de decisión, excepto que los árboles de regresión sirven para predecir una variable numérica en lugar de una categórica. Son útiles cuando no existe una relación lineal que nos permita predecir la variable con una regresión lineal:

viernes, 22 de noviembre de 2019

Data Science: Clustering K-Means: Cómo obtener el número óptimo de clusters (Teoría)

Para obtener el número óptimo de clusters a utilizar para k-means, existen dos métodos que podemos utilizar: El método del codo y el coeficiente de la silueta.

domingo, 17 de noviembre de 2019

jueves, 31 de octubre de 2019

Data Science: Regresión Lineal: Outliers y resumen

Vamos a ver el problema de los outliers en una regresión lineal y cómo solucionarlo. Y un pequeño resumen de las regresiones lineales hasta ahora:

miércoles, 30 de octubre de 2019

Data Science: Regresión no Lineal

A veces la relación entre dos variables no es lineal, y por tanto una regresión lineal no es el mejor modelo de predicción posible. Vamos a verlo con más detalle: