lunes, 24 de junio de 2019

Data Science: Las 5 etapas del análisis de datos

La ciencia de los datos es un campo que intenta extraer ideas, información útil, predicciones, etc. a partir de una cantidad de datos. Normalmente el análisis de datos sigue estas 5 etapas:



1. Enmarcar el problema. Hacer las preguntas adecuadas: ¿Cuál es el objetivo de la empresa? ¿Qué queremos estimar o predecir?

2. Adquirir y preparar los datos: ¿Qué recursos tenemos para obtener datos? ¿Qué información es relevante? Limpiar y filtrar los datos para su posterior análisis.

3. Explorar los datos: Visualizar los datos. Localizar en los gráficos las posibles tendencias, correlaciones o patrones.

4. Modelizar y evaluar los datos: Utilizar algún algoritmo innovador (según el problema) para crear el modelo. Evaluar el modelo.

5. Comunicar los resultados y/o puesta en producción: ¿Qué resultados hemos obtenido? ¿Qué hemos aprendido? ¿Los resultados tienen sentido?

Hay que tener en cuenta que estas etapas no son unidireccionales. Siempre es probable que tengamos que volver a uno de los pasos anteriores si surge algún problema, se nos ocurre alguna nueva idea, o si de repente tenemos acceso a un nuevo recurso al que antes no podíamos acceder.

No hay comentarios:

Publicar un comentario