Para establecer esta conexión, el controlador del servidor CAS (entorno UNIX/Linux) debe tener una configuración ODBC válida que utilice el controlador ODBC de Impala junto con el gestor UnixODBC.
Paso 1: Descarga de los componentes
Se necesitan dos componentes principales:
UnixODBC Driver Manager: Software de código abierto disponible en su sitio web oficial. Consulte la guía de instalación del controlador ODBC de Cloudera para verificar la versión compatible.
Controlador ODBC de Cloudera Impala: Para descargar desde el sitio web de Cloudera.
Nota: Si su entorno ya tiene un gestor ODBC, puede utilizarlo y simplemente añadir la configuración de Impala a los archivos existentes.
Paso 2: Instalación del gestor UnixODBC
En el controlador del servidor CAS, inicie sesión como usuario root para extraer y compilar el software. En este ejemplo, la instalación se realiza en el directorio /opt.
Terminal (Bash)
user@sas:~$$ gunzip unixODBC-2.3.4.tar.gz
user@sas:~$$ tar -xvf unixODBC-2.3.4.tar
A continuación, configure y compile UnixODBC:
Terminal (Bash)
user@sas:~$$ cd /opt/unixODBC-2.3.4
user@sas:~$$ ./configure --prefix=/opt/unixODBC-2.3.4 --disable-gui --disable-drivers
user@sas:~$$ make
Paso 3: Instalación del controlador ODBC de Impala
Instale el controlador RPM mediante un comando YUM. Por defecto, la instalación se realiza en /opt/cloudera/impalaodbc.
Terminal (Bash)
user@sas:~$$ cd /opt
user@sas:~$$ yum --nogpgcheck localinstall ClouderaImpalaODBC-2.5.35.1006-1.el7.x86
Paso 4: Configuración del enlace entre Impala y UnixODBC
Una vez instalados ambos componentes, es necesario reconfigurar el controlador UnixODBC para incluir ImpalaODBC en su ruta de búsqueda (search path).
Terminal (Bash)
user@sas:~$$ cd /opt/unixODBC-2.3.4
user@sas:~$$ export LD_LIBRARY_PATH=/opt/unixODBC-2.3.4/lib
user@sas:~$$ ./configure --prefix=/opt/cloudera/impalaodbc --with-unixodbc=/opt/unixODBC-2.3.4
user@sas:~$$ make
user@sas:~$$ make install
Paso 5: Actualización de los archivos odbc.ini y odbcinst.ini
El controlador de Cloudera proporciona archivos de ejemplo .ini ubicados en /opt/cloudera/impalaodbc/Setup/. Puede modificar estos archivos directamente o copiarlos a otra ubicación.
El elemento crítico es la actualización del archivo odbc.ini con la información de su clúster Hadoop (nombre de host y puerto del demonio de Impala).
Ejemplo de configuración para un clúster donde el demonio se ejecuta en el puerto estándar 21050:
/opt/cloudera/impalaodbc/Setup/RO
# Valeurs pour HOST, PORT, KrbFQDN, et KrbServiceName
HOST=sascdh01.race.sas.com
PORT=21050
Database=default
# Valeurs pour HOST, PORT, KrbFQDN, et KrbServiceName
Les codes et exemples fournis sur WeAreCAS.eu sont à but pédagogique. Il est impératif de ne pas les copier-coller aveuglément sur vos environnements de production. La meilleure approche consiste à comprendre la logique avant de l'appliquer. Nous vous recommandons vivement de tester ces scripts dans un environnement de test (Sandbox/Dev). WeAreCAS décline toute responsabilité quant aux éventuels impacts ou pertes de données sur vos systèmes.
SAS et tous les autres noms de produits ou de services de SAS Institute Inc. sont des marques déposées ou des marques de commerce de SAS Institute Inc. aux États-Unis et dans d'autres pays. ® indique un enregistrement aux États-Unis. WeAreCAS est un site communautaire indépendant et n'est pas affilié à SAS Institute Inc.
Ce site utilise des cookies techniques et analytiques pour améliorer votre expérience.
En savoir plus.