Loading

Configurar consultas paralelas en Tableau Desktop

Fecha de publicación: Jul 20, 2023
Tarea
Cómo configurar consultas paralelas en Tableau Desktop.
Pasos
Tableau Desktop puede iniciar varias conexiones paralelas automáticamente al comunicarse con una fuente de datos. Puede especificar cualquiera de las opciones siguientes:
  • Un límite global sobre el número de consultas paralelas para Tableau Desktop

  • Límites para un tipo de fuente de datos concreto, como SQL Server

  • Límites para un tipo de fuente de datos concreto en un servidor determinado

  • Límites para un tipo de fuente de datos concreto en un servidor determinado al conectarse a una base de datos específica

  • Límites sobre el número de fuentes de datos que se pueden consultar simultáneamente en una combinación entre bases de datos

Estas configuraciones están gestionadas por un archivo XML llamado connection-configs.xml que usted debe crear y guardar en la carpeta Tableau Desktop. Las ubicaciones predeterminadas son:

  • En un equipo de Windows: C:\Program Files\Tableau\Tableau <Version>
  • En Mac: La ubicación de la carpeta es Applications/Tableau.app/Content. Para acceder a esta carpeta desde el Finder, desplácese hasta la aplicación de Tableau, pulse Control+clic y seleccione Mostrar contenido del paquete.
HAGA CLIC PARA EXPANDIR LA SOLUCIÓN
A continuación se muestra un archivo connection-configs.xml de ejemplo.
<?xml version='1.0' encoding='utf-8' ?> 
<connection-list> 
<connection class='sqlserver' dbname='SalesDB' server='SQLserver10'> 
    <limit max='10'> 
    </limit> 
</connection> 
<connection class='mysql' dbname='Inventory' server='MySQL_Public'> 
    <limit max='10'> 
    </limit> 
</connection> 
<connection class='teradata' schema='TravelData' server='TeradataProduction2'> 
    <limit max='12'> 
    </limit> 
</connection> 
<connection class='sqlserver'> 
    <limit max='4'> 
    </limit> 
</connection> 
<connection class='mysql'> 
    <limit max='6'> 
    </limit> 
</connection> 
<connection class='teradata'> 
    <limit max='10'> 
    </limit> 
</connection> 
<connection> 
    <limit max='8'> 
    </limit> 
</connection> 
</connection-list> 

HAGA CLIC PARA EXPANDIR LA SOLUCIÓN
Establecer un límite global

Una etiqueta <connection> sin información sobre tipo de fuente de datos, servidor ni base de datos define el número máximo de consultas de todas las conexiones no cubiertas por otra especificación de conexión más específica. Ejemplo:

   <connection>
      <limit max='8'>
      </limit>
   </connection>

Este valor sobrescribe el límite predeterminado de consultas paralelas, que es de 16 para todos los tipos de fuentes de datos, excepto Amazon Redshift (cuyo valor predeterminado es 8).

Establecer límites adicionales

Los valores de conexión de connection-configs.xml pueden funcionar en distintos niveles de especificidad. Al establecer una conexión, Tableau analiza el archivo de arriba a abajo, así que si hay más de una entrada aplicable a una conexión determinada, se usa aquella situada más arriba.

Por este motivo, también resulta adecuado ordenar las especificaciones de conexión de más a menos específica.

Otros límites (no globales) se establecen en una sección <connection-list> de la parte superior del archivo connection-configs.xml.

Los parámetros que se pueden usar en una etiqueta <connection> son:

ParámetroCadena
classTipo de fuente de datos. Consulte la tabla “Cadenas de clase” a continuación para ver las cadenas que se usan en todos los tipos de fuentes de datos.
servidorEquipo servidor.
dbnameNombre de la base de datos.
schemaEste valor puede resultar de utilidad con fuentes de datos Teradata.

Es posible especificar parámetros en cualquier orden y combinación, por ejemplo, se puede especificar server y dbname sin especificar class.

HAGA CLIC PARA EXPANDIR LA SOLUCIÓN
Cadenas de clase

Use las siguientes cadenas para identificar tipos de fuentes de datos en connection-configs.xml.

Fuente de datosCadena
Actian Vectorwise"vectorwise"
Amazon EMR"awshadoophive"
Amazon Redshift“redshift”
Base de datos Aster"asterncluster"
Cloudera Hadoop"hadoophive"
Extractos creados a partir de fuentes de datos de cuboNo configurable.
DataStax Enterprise"datastax"
EXASolution"exasolution"
Firebird"firebird"
ODBC genérico"genericodbc"
Google Analytics"google-analytics"
Google BigQuery"bigquery"
Hortonworks Hadooop Hive"hortonworkshadoophive"
HP Vertica“vertica”
IBM BigInsights“bigsql”
IBM DB2"db2"
JavaScript Connector"jsconnector"
MapR Hadoop Hive"maprhadoophive"
MarkLogic"marklogic"
Microsoft Access"msaccess”
Microsoft Analysis Services"msolap"
Microsoft ExcelNo configurable.
Microsoft PowerPivot"powerpivot"
Microsoft SQL Server"sqlserver"
MySQL"mysql"
IBM Netezza"netezza"
OData“odata”
Oracle"oracle"
Oracle Essbase“essbase”
ParAccel"paraccel"
Pivotal Greenplum"greenplum"
PostgreSQL"postgres"
Progress OpenEdge"progressopenedge"
SAP HANA"saphana"
SAP Netweaver Business Warehouse"sapbw"
SAP Sybase ASE"sybasease"
SAP Sybase IQ"sybaseiq"
Salesforce"salesforce"
Spark SQL"spark"
Splunk"splunk"
Archivo estadísticoNo configurable.
Extracción de datos de Tableau"dataengine"
Teradata“teradata”
Archivo de texto“csv”
HAGA CLIC PARA EXPANDIR LA SOLUCIÓN
Registro

Cuando las conexiones se relacionan con entradas del archivo connection-configs.xml, Tableau registra el límite de conexión con fines de depuración.

Recursos adicionales
Antes de la versión 9.0, Tableau Desktop mantenía una única conexión por fuente de datos y enviaba todas las consultas secuencialmente. Con el procesamiento de consultas en serie, el tiempo transcurrido para la ejecución de todas las consultas en una fuente de datos era igual o mayor que la suma del tiempo transcurrido para cada ejecución de consulta individual.

Pero muchos sistemas de bases de datos están diseñados para ejecutar consultas de manera simultánea y, así, poder reducir el tiempo transcurrido total que se dedica a ejecutar todas las consultas necesarias para una fuente de datos.


Número del artículo de conocimiento

001453728

 
Cargando
Salesforce Help | Article