domingo, 28 de julio de 2019

Data Science: Joins entre datasets. Teoría en imágenes

Al igual que con bases de datos relacionales, en las que podemos hacer consultas haciendo joins o uniones de tablas a través de un campo clave que se comparta en ambas, con Python podemos hacer exactamente lo mismo con diferentes datasets que compartan algún campo.

Aunque explicaremos en otra entrada cómo hacerlo en código, aquí va una recopilación de imágenes de la teoría de los diferentes joins que se pueden hacer, para recordar.
Lo primero que vamos a hacer es importar una función que nos permita cargar imágenes desde nuestro PC:


Cargamos la imagen del Inner Join. Si recordamos, éste join nos traerá las filas que compartan valor en ambos datasets:


Cargamos la imagen del Left Join: Éste join nos traerá todas las filas del dataset A. Los campos que se encuentren en A pero no en B vendrán vacíos.


Cargamos la imagen del Right Join: Éste join nos traerá todas las filas del dataset B. Los campos que se encuentren en B pero no en A vendrán vacíos.


Cargamos la imagen del Outer Join: Éste join nos traerá todas las filas de ambos datasets. Los campos que se encuentren en A pero no en B vendrán vacíos, y viceversa.


Y eso es todo.

No hay comentarios:

Publicar un comentario