Tableau

Cómo hacer un Join en Tableau Prep

Muchas veces, antes de analizar y visualizar los datos mediante un software de business intelligence, es necesario preparar la base de datos mediante procedimientos ETL (Extract Transform Load). Aunque existen varios tipos de software que permiten realizar estas operaciones, Tableau Prep destaca por su facilidad de uso gracias a su interfaz de arrastrar y soltar y al enfoque visual del software.

En este artículo veremos cómo realizar un Join en Tableau Prep, es decir, cómo combinar datos de diferentes tablas y/o fuentes de datos en una sola. Un join es una de las manipulaciones más populares y utilizadas porque permite integrar datos en una única fuente de datos para poder responder a preguntas que no se responderían consultando tablas individuales.

Cómo hacer un Join

Por ejemplo, utilizaremos dos tablas con datos de Spotify de 2023: una contiene información sobre el álbum, el artista y el título de la canción (tabla primaria), la otra contiene información sobre la intensidad de cada canción y la facilidad con la que la gente puede bailarla (tabla con información adicional). Para saber qué canciones son las más bailables o transmiten más energía a los oyentes, es necesario crear una única base de datos en la que se unan estas dos tablas.

Una vez establecida la conexión en Tableau Prep y limpiados los datos según nuestras necesidades, podemos realizar la unión. Basta con añadir un paso de unión (join step) seleccionándolo en el menú desplegable situado a la derecha del paso que queremos que preceda al paso de unión, o arrastrando el último paso de limpieza de una fuente sobre el de la otra.

Join
Join Step

Los 5 tipos de Join en Tableau Prep

Una vez añadido el join step, veremos aparecer el siguiente desplegable que nos permite configurar, editar y previsualizar los resultados del join.

Desde aquí también podemos establecer la cláusula join (es decir, el criterio según el cual se unirán las tablas) y el tipo de join (es decir, el número y origen de las filas que devolverá el join). Es importante reflexionar detenidamente sobre la cláusula y el tipo de unión que se utilizarán, ya que determinan los datos que se excluirán y los que se incluirán en la base de datos final.

Configurar Join

Existen 5 tipos principales de join en Tableau Prep:

1. Inner Join

La unión interna (Inner Join) devuelve sólo los registros que satisfacen la clave de unión, excluyendo todos los demás. Esta es la solución por defecto propuesta por Prep y es adecuada si desea filtrar todos los valores nulos.

En nuestro caso, sólo devolvería canciones con id presente e igual en ambas tablas.

Inner Join

2. Not Inner Join

El tipo Not Inner es el opuesto al visto anteriormente; devuelve valores que no satisfacen la clave de unión. Este tipo de unión se utiliza mucho para mejorar la calidad de los datos, es decir, para identificar y procesar los registros que no cumplen una condición determinada.

En nuestro caso, devolvería las canciones que no están presentes en ambas tablas, es decir, que tienen un id presente sólo en una de las dos tablas.

Not Inner Join

3. Left Join

La Left Join (unión izquierda) devuelve todos los registros que satisfacen la clave de unión más todos los que no la satisfacen y proceden de la tabla de la izquierda (o identificados con el color rosa).

En nuestro ejemplo, utilizaremos este tipo de unión porque para cada canción (tabla de la izquierda) queremos saber el nivel relativo de intensidad y aptitud para el baile (tabla de la derecha). Por tanto, querremos todos los registros de la tabla de la izquierda (es decir, todas las canciones), mientras que sólo querremos conocer la información adicional de las canciones que estén presentes en la tabla de la izquierda (y no de las canciones que no estén presentes en la tabla de canciones de origen).

Left Join

4. Right Join

La Right Join (unión a la derecha) aplica la misma lógica que la unión a la izquierda, pero a la tabla derecha en lugar de a la izquierda. En consecuencia, devuelve todos los registros que satisfacen la clave de unión más todos los registros que no la satisfacen y que proceden de la tabla derecha (identificados por el color azul).

En nuestro caso, devolvería todos los registros que satisfacen la clave de unión (las canciones cuyo id está presente en ambas tablas) más las canciones adicionales que están presentes en la tabla de la derecha (de las que tenemos información sobre la intensidad y la propensión a bailar) pero que no tienen un valor correspondiente en la tabla de la izquierda (no conocemos el título ni el nombre del álbum).

Right Join

5. Full Outer

La Full Outer (unión completa) devuelve todos los registros de ambas tablas. Los registros que satisfacen la clave de unión se unen en la misma fila, mientras que los que no satisfacen la clave se añaden en filas diferentes.

En nuestro caso, devolvería todos los registros de ambas tablas.

Full Outer

Cómo editar un Join

Una vez establecidas las cláusulas y el tipo de Join que consideramos más adecuado (en nuestro caso el join izquierdo), Prep muestra una vista previa del resultado.

Summary of Join Results

El cuadro «Summary of Join Results»  muestra el número de filas incluidas de cada origen, el número de filas excluidas (y su origen) y el número total de filas en el resultado final. Al seleccionar un tipo de Join mediante la interacción con el diagrama de Venn, consultar esta matriz puede ser útil para comprobar el resultado de forma rápida e intuitiva. Además, en el caso de que Prep detecte otros campos con un nombre común en las dos fuentes de datos, el software sugiere estos campos como cláusula adicional, pero por supuesto queda a nuestra elección incluirla o no.

Conclusiones

Una vez que estés conforme con la configuración y el resultado de la unión, sólo queda limpiar la nueva base de datos y exportarla en el formato que nos resulte más útil para proceder al análisis y la visualización.

Recuerda siempre comprobar que los datos obtenidos tienen sentido, ya que el número propuesto en el Resumen de resultados no es suficiente para evaluar la calidad del resultado obtenido.

Esperamos que este artículo te haya sido útil para entender la lógica y ejecución de un join en Tableau Prep, pero si aún tienes dudas o preguntas, ¡no dudes en escribirnos!

Lee todos nuestros artículos sobre Tableau

¿Quieres conocer las últimas novedades o profundizar en algunas características para convertirte en un experto?

Visualitics Team
Este artículo ha sido escrito y editado por uno de nuestros consultores

Compártelo ahora en tus redes sociales o por correo electrónico:

Suscríbete al boletín

Para estar informado sobre las novedades de Tableau y Alteryx, sobre nuestros productos y servicios y sobre los próximos eventos de Visualitics, suscríbete a nuestro boletín. ¡Puedes elegir el tipo de envío que prefieres y darte de baja en cualquier momento!
¿Qué novedades quieres recibir?
¿Qué empresa trata tus datos?

VISUALITICS PARTNERS, S.L. (en adelante, “VISUALITICS“)

¿Por qué tratamos los datos que te pedimos?

Únicamente tratamos tus datos para poder prestarte los servicios de VISUALITICS + info

¿Cuál es la legitimación para este tratamiento de tus datos?

Estos datos son necesarios para llevar a cabo la prestación de los servicios ofrecidos por VISUALITICS + info

¿Se van a hacer cesiones o transferencias con tus datos?

Si así lo consientes, tus datos podrán ser cedidos a terceras empresas. + info

¿Cuáles son mis derechos?

El interesado tiene derecho a ejercitar su derecho de:

– Acceso, rectificación, supresión, oposición, portabilidad de los Datos, limitación del tratamiento y a no ser objeto de decisiones automatizadas individualizadas + info

¿Tienes dudas?

Tanto si tienes alguna o sugerencia como si quieres darte de baja ponte en contacto con nosotros enviando un email a la siguiente dirección: info@visualitics.es