La ciencia de los datos es un campo que intenta extraer ideas, información útil, predicciones, etc. a partir de una cantidad de datos. Normalmente el análisis de datos sigue estas 5 etapas:
1. Enmarcar el problema. Hacer las preguntas adecuadas: ¿Cuál es el objetivo de la empresa? ¿Qué queremos estimar o predecir?
2. Adquirir y preparar los datos: ¿Qué recursos tenemos para obtener datos? ¿Qué información es relevante? Limpiar y filtrar los datos para su posterior análisis.
3. Explorar los datos: Visualizar los datos. Localizar en los gráficos las posibles tendencias, correlaciones o patrones.
4. Modelizar y evaluar los datos: Utilizar algún algoritmo innovador (según el problema) para crear el modelo. Evaluar el modelo.
5. Comunicar los resultados y/o puesta en producción: ¿Qué resultados hemos obtenido? ¿Qué hemos aprendido? ¿Los resultados tienen sentido?
Hay que tener en cuenta que estas etapas no son unidireccionales. Siempre es probable que tengamos que volver a uno de los pasos anteriores si surge algún problema, se nos ocurre alguna nueva idea, o si de repente tenemos acceso a un nuevo recurso al que antes no podíamos acceder.
No hay comentarios:
Publicar un comentario