Vamos a empezar con Machine Learning y Python. Lo primero es instalar todas las herramientas necesarias.
Lo primero que necesitamos instalar es Anaconda. Anaconda es un plataforma muy popular para ciencia de datos con Python e incluye muchas herramientas necesarias.
Para descargarlo, no hay más que acudir a su web oficial: https://www.anaconda.com/ y tras pulsar en el botón "Download", seleccionar el sistema operativo que utilicemos. Lo descargamos y lo instalamos.
Después de instalar Anaconda, deberíamos instalar "pip", que es un sistema que nos va a permitir instalar por consola de comandos las diferentes librerías Python necesarias para análisis de datos.
Como he dicho, normalmente tendríamos que instalar "pip" por separado. Yo lo que hice es descargar e instalar Python de su web oficial: https://www.python.org/ y acordarme de marcar la casilla para que te lo añada al PATHde variables de entorno:
Al final de la instalación nos pedirá que eliminemos el límite de caracteres que Windows pone por defecto al PATH:
Lo pulsamos y listo. Ahora la consola de comandos ya nos reconocerá los comandos de "pip".
Por último, debemos instalar, mediante "pip" las siguientes librerías estándar para machine learning:
- pandas: Nos permitirá leer y hacer operaciones con datasets, calcular estadísticos básicos, etc.
- NumPy: Nos permitirá realizar operaciones matemáticas con matrices de datos y generar matrices con valores aleatorios para tener datasets con datos de pruebas sobre los cuales realizar nuestros análisis.
- matplotlib: Nos permitirá generar gráficos de estadísticas en 2D.
- IPython: Nos proporciona un IDE con funciones específicas y la posibilidad de crear notebooks.
- scikit-learn: Está basado en los tres primeros paquetes (pandas, Numpy, y matplotlib) y nos permite realizar análisis predictivos.
Por supuesto, si googleamos cada una de las librerías podemos obtener información más detallada de cada una, lo anterior es un resumen básico y práctico.
Para instalarlas, abrimos una consola de comandos e introducimos el comando "pip install nombre-paquete", de tal forma que tendríamos que introducir, uno por uno, los siguientes comandos:
pip install pandas
pip install NumPy
pip install matplotlib
pip install IPython
pip install scikit-learn
Una vez instaladas, ya estaríamos preparados para lo básico.
No hay comentarios:
Publicar un comentario