Data science

Herramientas In-DB de Alteryx: Parte 1

Siempre que se procesan datos de una base de datos, un programa tradicional realiza los siguientes pasos:

  1. Descarga los datos propiamente dichos en un archivo temporal de tu ordenador local;
  2. Importa estos datos al programa.

 

Lo mismo ocurre con la herramienta de importación clásica de Alteryx: la Input Data Tool. Así, independientemente de dónde resida su base de datos, los datos deben pasar primero por la red del ordenador, y sólo entonces se procesan de nuevo. Ni que decir tiene que este proceso puede ser lento, sobre todo cuando se produce una alta latencia en la red al conectarse a BD que contienen tablas de gran tamaño.

Las herramientas in-DB de Alteryx, por otro lado, tienen la gran ventaja de permitir que los datos se procesen dentro de la propia base de datos, sin salir nunca del entorno de la BD. Esto garantiza un aumento significativo del rendimiento en comparación con los métodos de análisis tradicionales, que en cambio implican la importación de datos a un entorno independiente.

En otras palabras, las herramientas In-DB permiten a los usuarios crear visualmente su propia consulta SQL. Por lo tanto, al escribir fórmulas o filtrar datos en las herramientas In-DB, sólo funcionará la sintaxis SQL y no las funciones específicas de Alteryx. No obstante, los flujos de trabajo estándar pueden integrarse fácilmente con los flujos de trabajo In-DB para una mayor fusión y análisis de los datos.

En este caso, los datos se transmitirán de la base de datos al ordenador local utilizando la herramienta Data Stream Out.

Como puedes ver en el siguiente ejemplo, los colores de los iconos cambian de azul a verde cuando pasamos de la BD, al flujo de trabajo tradicional de Alteryx.

En definitiva, podemos decir que las herramientas In-DB de Alteryx permiten generar consultas SQL sin conocer realmente el lenguaje (o sin conocerlo en absoluto); esto es gracias al método tradicional de arrastrar y soltar.  

A continuación se muestra una lista de bases de datos que se pueden integrar: Amazon Redshift, Apache Spark ODBC, Cloudera Impala, Databricks, EXASOL, Hive, IBM Netezza, Microsoft Analytics Platform System, Microsoft Azure SQL Database, Microsoft Azure SQL Data Warehouse, Microsoft SQL Server 2008, 2012, 2014, 2016, MySQL, Oracle, Pivotal Greenplum, PostgreSQL, SAP Hana, Snowflake, Teradata, Vertica.

Si tienes dudas o quieres más información, no dudes en escribirnos a info@visualitics.es.

Suscríbete al boletín

Para estar informado sobre las novedades de Tableau y Alteryx, sobre nuestros productos y servicios y sobre los próximos eventos de Visualitics, suscríbete a nuestro boletín. ¡Puedes elegir el tipo de envío que prefieres y darte de baja en cualquier momento!
¿Qué novedades quieres recibir?
¿Qué empresa trata tus datos?

VISUALITICS PARTNERS, S.L. (en adelante, “VISUALITICS“)

¿Por qué tratamos los datos que te pedimos?

Únicamente tratamos tus datos para poder prestarte los servicios de VISUALITICS + info

¿Cuál es la legitimación para este tratamiento de tus datos?

Estos datos son necesarios para llevar a cabo la prestación de los servicios ofrecidos por VISUALITICS + info

¿Se van a hacer cesiones o transferencias con tus datos?

Si así lo consientes, tus datos podrán ser cedidos a terceras empresas. + info

¿Cuáles son mis derechos?

El interesado tiene derecho a ejercitar su derecho de:

– Acceso, rectificación, supresión, oposición, portabilidad de los Datos, limitación del tratamiento y a no ser objeto de decisiones automatizadas individualizadas + info

¿Tienes dudas?

Tanto si tienes alguna o sugerencia como si quieres darte de baja ponte en contacto con nosotros enviando un email a la siguiente dirección: info@visualitics.es