Cuando tenemos un dataset con muchas variables, se hace necesario un método para reducir el número de variables a tener en cuenta a las más significativas. Para eso se utiliza el ACP:
Mostrando entradas con la etiqueta Estadística. Mostrar todas las entradas
Mostrando entradas con la etiqueta Estadística. Mostrar todas las entradas
lunes, 16 de diciembre de 2019
jueves, 12 de diciembre de 2019
Data Science: K Nearest Neighbors
Vamos a ver otra técnica de clasificación, la de los K Nearest Neighbors:
domingo, 1 de diciembre de 2019
Data Science: Support Vector Machines
Los Support Vector Machines son otra forma más avanzada de clasificar y/o predecir valores para un conjunto de datos.
jueves, 28 de noviembre de 2019
Data Science: Árboles y Bosques Aleatorios - Árboles de Regresión
Los árboles de regresión son iguales que los de decisión, excepto que los árboles de regresión sirven para predecir una variable numérica en lugar de una categórica. Son útiles cuando no existe una relación lineal que nos permita predecir la variable con una regresión lineal:
miércoles, 27 de noviembre de 2019
martes, 26 de noviembre de 2019
Data Science: Árboles y Bosques Aleatorios - Entropía y ganancia de información
Entropía y ganancia de información:
viernes, 22 de noviembre de 2019
Data Science: Clustering K-Means: Cómo obtener el número óptimo de clusters (Teoría)
Para obtener el número óptimo de clusters a utilizar para k-means, existen dos métodos que podemos utilizar: El método del codo y el coeficiente de la silueta.
jueves, 21 de noviembre de 2019
Data Science: Clustering K-Means (Teoría)
Un clustering también se puede hacer por el método k-means:
martes, 19 de noviembre de 2019
Data Science: Clustering Jerárquico y Métodos de Enlace (Teoría)
Vamos a ver los diferentes métodos de enlace que se pueden utilizar para hacer un clustering jerárquico:
Data Science: Clustering y Distancia (Teoría)
Vamos a ver un poco de teoría de Clustering y el concepto de Distancia:
lunes, 18 de noviembre de 2019
domingo, 17 de noviembre de 2019
Data Science: Regresión Logística: Matrices de confusión y curvas ROC (Teoría)
Vamos a ver teoría en imágenes más validaciones de regresiones logísticas. En concreto, matrices de confusión y curvas ROC:
sábado, 16 de noviembre de 2019
Data Science: Regresión Logística: Validaciones Cruzadas (Teoría)
Vamos a ver un resumen con imágenes de los tipos de validaciones cruzadas que existen:
viernes, 1 de noviembre de 2019
jueves, 31 de octubre de 2019
Data Science: Regresión Lineal: Outliers y resumen
Vamos a ver el problema de los outliers en una regresión lineal y cómo solucionarlo. Y un pequeño resumen de las regresiones lineales hasta ahora:
miércoles, 30 de octubre de 2019
Data Science: Regresión no Lineal
A veces la relación entre dos variables no es lineal, y por tanto una regresión lineal no es el mejor modelo de predicción posible. Vamos a verlo con más detalle:
martes, 29 de octubre de 2019
Data Science: Regresión Lineal con variables categóricas
Vamos a ver ahora cómo hacer una regresión lineal con variables categóricas:
Suscribirse a:
Entradas (Atom)









