Siempre que se procesan datos de una base de datos, un programa tradicional realiza los siguientes pasos:
- Descarga los datos propiamente dichos en un archivo temporal de tu ordenador local;
- Importa estos datos al programa.
Lo mismo ocurre con la herramienta de importación clásica de Alteryx: la Input Data Tool. Así, independientemente de dónde resida su base de datos, los datos deben pasar primero por la red del ordenador, y sólo entonces se procesan de nuevo. Ni que decir tiene que este proceso puede ser lento, sobre todo cuando se produce una alta latencia en la red al conectarse a BD que contienen tablas de gran tamaño.
Las herramientas in-DB de Alteryx, por otro lado, tienen la gran ventaja de permitir que los datos se procesen dentro de la propia base de datos, sin salir nunca del entorno de la BD. Esto garantiza un aumento significativo del rendimiento en comparación con los métodos de análisis tradicionales, que en cambio implican la importación de datos a un entorno independiente.
En otras palabras, las herramientas In-DB permiten a los usuarios crear visualmente su propia consulta SQL. Por lo tanto, al escribir fórmulas o filtrar datos en las herramientas In-DB, sólo funcionará la sintaxis SQL y no las funciones específicas de Alteryx. No obstante, los flujos de trabajo estándar pueden integrarse fácilmente con los flujos de trabajo In-DB para una mayor fusión y análisis de los datos.
En este caso, los datos se transmitirán de la base de datos al ordenador local utilizando la herramienta Data Stream Out.
Como puedes ver en el siguiente ejemplo, los colores de los iconos cambian de azul a verde cuando pasamos de la BD, al flujo de trabajo tradicional de Alteryx.
En definitiva, podemos decir que las herramientas In-DB de Alteryx permiten generar consultas SQL sin conocer realmente el lenguaje (o sin conocerlo en absoluto); esto es gracias al método tradicional de arrastrar y soltar.
A continuación se muestra una lista de bases de datos que se pueden integrar: Amazon Redshift, Apache Spark ODBC, Cloudera Impala, Databricks, EXASOL, Hive, IBM Netezza, Microsoft Analytics Platform System, Microsoft Azure SQL Database, Microsoft Azure SQL Data Warehouse, Microsoft SQL Server 2008, 2012, 2014, 2016, MySQL, Oracle, Pivotal Greenplum, PostgreSQL, SAP Hana, Snowflake, Teradata, Vertica.
Si tienes dudas o quieres más información, no dudes en escribirnos a info@visualitics.es.