Um diese Verbindung herzustellen, muss der CAS-Server-Controller (UNIX/Linux-Umgebung) über eine gültige ODBC-Konfiguration verfügen, die den ImpalaODBC-Treiber in Verbindung mit dem UnixODBC-Manager verwendet.
Schritt 1: Herunterladen der Komponenten
Zwei Hauptkomponenten sind erforderlich:
UnixODBC Driver Manager: Open-Source-Software, die auf der offiziellen Website verfügbar ist. Überprüfen Sie im Installationshandbuch für den Cloudera ODBC-Treiber die kompatible Version.
Cloudera ImpalaODBC-Treiber: Zum Herunterladen von der Cloudera-Website.
Hinweis: Wenn Ihre Umgebung bereits über einen ODBC-Manager verfügt, können Sie diesen verwenden und einfach die Impala-Konfiguration zu den vorhandenen Dateien hinzufügen.
Schritt 2: Installation des UnixODBC-Managers
Melden Sie sich auf dem CAS-Server-Controller als root-Benutzer an, um die Software zu extrahieren und zu kompilieren. In diesem Beispiel erfolgt die Installation im Verzeichnis /opt.
Terminal (Bash)
user@sas:~$$ gunzip unixODBC-2.3.4.tar.gz
user@sas:~$$ tar -xvf unixODBC-2.3.4.tar
Konfigurieren und kompilieren Sie anschließend UnixODBC:
Terminal (Bash)
user@sas:~$$ cd /opt/unixODBC-2.3.4
user@sas:~$$ ./configure --prefix=/opt/unixODBC-2.3.4 --disable-gui --disable-drivers
user@sas:~$$ make
Installieren Sie den RPM-Treiber mit einem YUM-Befehl. Standardmäßig erfolgt die Installation in /opt/cloudera/impalaodbc.
Terminal (Bash)
user@sas:~$$ cd /opt
user@sas:~$$ yum --nogpgcheck localinstall ClouderaImpalaODBC-2.5.35.1006-1.el7.x86
Schritt 4: Konfiguration der Verbindung zwischen Impala und UnixODBC
Nachdem beide Komponenten installiert sind, muss der UnixODBC-Treiber neu konfiguriert werden, um ImpalaODBC in seinen Suchpfad aufzunehmen.
Terminal (Bash)
user@sas:~$$ cd /opt/unixODBC-2.3.4
user@sas:~$$ export LD_LIBRARY_PATH=/opt/unixODBC-2.3.4/lib
user@sas:~$$ ./configure --prefix=/opt/cloudera/impalaodbc --with-unixodbc=/opt/unixODBC-2.3.4
user@sas:~$$ make
user@sas:~$$ make install
Schritt 5: Aktualisierung der Dateien odbc.ini und odbcinst.ini
Der Cloudera-Treiber stellt Beispieldateien .ini zur Verfügung, die sich in /opt/cloudera/impalaodbc/Setup/ befinden. Sie können diese Dateien direkt ändern oder an einen anderen Speicherort kopieren.
Der kritische Punkt ist die Aktualisierung der Datei odbc.ini mit den Informationen Ihres Hadoop-Clusters (Hostname und Port des Impala-Daemons).
Konfigurationsbeispiel für einen Cluster, bei dem der Daemon auf dem Standardport 21050 läuft:
/opt/cloudera/impalaodbc/Setup/RO
# Valeurs pour HOST, PORT, KrbFQDN, et KrbServiceName
HOST=sascdh01.race.sas.com
PORT=21050
Database=default
# Valeurs pour HOST, PORT, KrbFQDN, et KrbServiceName
Los códigos y ejemplos proporcionados en WeAreCAS.eu son con fines educativos. Es imperativo no copiarlos y pegarlos ciegamente en sus entornos de producción. El mejor enfoque es comprender la lógica antes de aplicarla. Recomendamos encarecidamente probar estos scripts en un entorno de prueba (Sandbox/Dev). WeAreCAS no acepta ninguna responsabilidad por cualquier impacto o pérdida de datos en sus sistemas.
SAS y todos los demás nombres de productos o servicios de SAS Institute Inc. son marcas registradas o marcas comerciales de SAS Institute Inc. en los EE. UU. y otros países. ® indica registro en los EE. UU. WeAreCAS es un sitio comunitario independiente y no está afiliado a SAS Institute Inc.
Este sitio utiliza cookies técnicas y analíticas para mejorar su experiencia.
Saber más.