ELECTROBÓVEDA: Estadística

¡Únete a aquellos con mente abierta para crear y audacia para liberar a sus creaciones!

Mostrando entradas con la etiqueta Estadística. Mostrar todas las entradas

lunes, 16 de diciembre de 2019

Data Science: Análisis de los Componentes Principales

Cuando tenemos un dataset con muchas variables, se hace necesario un método para reducir el número de variables a tener en cuenta a las más significativas. Para eso se utiliza el ACP:

Leer la entrada completa

Publicado por Misispiclix en 12:42:00 No hay comentarios:

Enviar por correo electrónico Escribe un blog Compartir en X Compartir con Facebook Compartir en Pinterest

Etiquetas: Data Science, Estadística, Python

jueves, 12 de diciembre de 2019

Data Science: K Nearest Neighbors

Vamos a ver otra técnica de clasificación, la de los K Nearest Neighbors:

Leer la entrada completa

Publicado por Misispiclix en 10:09:00 No hay comentarios:

Enviar por correo electrónico Escribe un blog Compartir en X Compartir con Facebook Compartir en Pinterest

Etiquetas: Data Science, Estadística, Python

domingo, 1 de diciembre de 2019

Data Science: Support Vector Machines

Los Support Vector Machines son otra forma más avanzada de clasificar y/o predecir valores para un conjunto de datos.

Leer la entrada completa

Publicado por Misispiclix en 9:23:00 No hay comentarios:

Enviar por correo electrónico Escribe un blog Compartir en X Compartir con Facebook Compartir en Pinterest

Etiquetas: Data Science, Estadística, Python

jueves, 28 de noviembre de 2019

Data Science: Árboles y Bosques Aleatorios

Publicado por Misispiclix en 13:21:00 No hay comentarios:

Enviar por correo electrónico Escribe un blog Compartir en X Compartir con Facebook Compartir en Pinterest

Etiquetas: Data Science, Estadística, Python

Data Science: Árboles y Bosques Aleatorios - Árboles de Regresión

Los árboles de regresión son iguales que los de decisión, excepto que los árboles de regresión sirven para predecir una variable numérica en lugar de una categórica. Son útiles cuando no existe una relación lineal que nos permita predecir la variable con una regresión lineal:

Leer la entrada completa

Publicado por Misispiclix en 10:45:00 No hay comentarios:

Enviar por correo electrónico Escribe un blog Compartir en X Compartir con Facebook Compartir en Pinterest

Etiquetas: Data Science, Estadística, Python

miércoles, 27 de noviembre de 2019

Data Science: Árboles y Bosques Aleatorios - Algoritmos

Algoritmos para Árboles aleatorios:

Leer la entrada completa

Publicado por Misispiclix en 11:37:00 No hay comentarios:

Enviar por correo electrónico Escribe un blog Compartir en X Compartir con Facebook Compartir en Pinterest

Etiquetas: Data Science, Estadística, Python

martes, 26 de noviembre de 2019

Data Science: Árboles y Bosques Aleatorios - Entropía y ganancia de información

Entropía y ganancia de información:

Leer la entrada completa

Publicado por Misispiclix en 16:24:00 No hay comentarios:

Enviar por correo electrónico Escribe un blog Compartir en X Compartir con Facebook Compartir en Pinterest

Etiquetas: Data Science, Estadística, Python

Data Science: Árboles y Bosques Aleatorios - Introducción

Introducción.

Leer la entrada completa

Publicado por Misispiclix en 14:18:00 No hay comentarios:

Enviar por correo electrónico Escribe un blog Compartir en X Compartir con Facebook Compartir en Pinterest

Etiquetas: Data Science, Estadística, Python

Data Science: Clustering Propagación de la afinidad y resumen

Publicado por Misispiclix en 11:44:00 No hay comentarios:

Enviar por correo electrónico Escribe un blog Compartir en X Compartir con Facebook Compartir en Pinterest

Etiquetas: Data Science, Estadística, Python

viernes, 22 de noviembre de 2019

Data Science: Clustering K-Means: Cómo obtener el número óptimo de clusters (Teoría)

Para obtener el número óptimo de clusters a utilizar para k-means, existen dos métodos que podemos utilizar: El método del codo y el coeficiente de la silueta.

Leer la entrada completa

Publicado por Misispiclix en 13:15:00 No hay comentarios:

Enviar por correo electrónico Escribe un blog Compartir en X Compartir con Facebook Compartir en Pinterest

Etiquetas: Data Science, Estadística, Python

jueves, 21 de noviembre de 2019

Data Science: Clustering K-Means (Teoría)

Un clustering también se puede hacer por el método k-means:

Leer la entrada completa

Publicado por Misispiclix en 13:15:00 No hay comentarios:

Enviar por correo electrónico Escribe un blog Compartir en X Compartir con Facebook Compartir en Pinterest

Etiquetas: Data Science, Estadística, Python

martes, 19 de noviembre de 2019

Data Science: Clustering Jerárquico y Métodos de Enlace (Teoría)

Vamos a ver los diferentes métodos de enlace que se pueden utilizar para hacer un clustering jerárquico:

Leer la entrada completa

Publicado por Misispiclix en 12:56:00 No hay comentarios:

Enviar por correo electrónico Escribe un blog Compartir en X Compartir con Facebook Compartir en Pinterest

Etiquetas: Data Science, Estadística, Python

Data Science: Clustering y Distancia (Teoría)

Vamos a ver un poco de teoría de Clustering y el concepto de Distancia:

Leer la entrada completa

Publicado por Misispiclix en 9:36:00 No hay comentarios:

Enviar por correo electrónico Escribe un blog Compartir en X Compartir con Facebook Compartir en Pinterest

Etiquetas: Data Science, Estadística, Python

lunes, 18 de noviembre de 2019

Data Science: Regresión Logística: Resumen Final

Publicado por Misispiclix en 12:16:00 No hay comentarios:

Enviar por correo electrónico Escribe un blog Compartir en X Compartir con Facebook Compartir en Pinterest

Etiquetas: Data Science, Estadística, Python

domingo, 17 de noviembre de 2019

Data Science: Regresión Logística: Matrices de confusión y curvas ROC (Teoría)

Vamos a ver teoría en imágenes más validaciones de regresiones logísticas. En concreto, matrices de confusión y curvas ROC:

Leer la entrada completa

Publicado por Misispiclix en 10:19:00 No hay comentarios:

Enviar por correo electrónico Escribe un blog Compartir en X Compartir con Facebook Compartir en Pinterest

Etiquetas: Data Science, Estadística, Python

sábado, 16 de noviembre de 2019

Data Science: Regresión Logística: Validaciones Cruzadas (Teoría)

Vamos a ver un resumen con imágenes de los tipos de validaciones cruzadas que existen:

Leer la entrada completa

Publicado por Misispiclix en 10:51:00 No hay comentarios:

Enviar por correo electrónico Escribe un blog Compartir en X Compartir con Facebook Compartir en Pinterest

Etiquetas: Data Science, Estadística, Python

viernes, 1 de noviembre de 2019

Data Science: Regresión Logística: Introducción

Vamos a ver qué es una Regresión Logística:

Leer la entrada completa

Publicado por Misispiclix en 12:53:00 No hay comentarios:

Enviar por correo electrónico Escribe un blog Compartir en X Compartir con Facebook Compartir en Pinterest

Etiquetas: Data Science, Estadística, Python

jueves, 31 de octubre de 2019

Data Science: Regresión Lineal: Outliers y resumen

Vamos a ver el problema de los outliers en una regresión lineal y cómo solucionarlo. Y un pequeño resumen de las regresiones lineales hasta ahora:

Leer la entrada completa

Publicado por Misispiclix en 8:46:00 No hay comentarios:

Enviar por correo electrónico Escribe un blog Compartir en X Compartir con Facebook Compartir en Pinterest

Etiquetas: Data Science, Estadística, Python

miércoles, 30 de octubre de 2019

Data Science: Regresión no Lineal

A veces la relación entre dos variables no es lineal, y por tanto una regresión lineal no es el mejor modelo de predicción posible. Vamos a verlo con más detalle:

Leer la entrada completa