Um diese Verbindung herzustellen, muss der CAS-Server-Controller (UNIX/Linux-Umgebung) über eine gültige ODBC-Konfiguration verfügen, die den ImpalaODBC-Treiber in Verbindung mit dem UnixODBC-Manager verwendet.
Schritt 1: Herunterladen der Komponenten
Zwei Hauptkomponenten sind erforderlich:
UnixODBC Driver Manager: Open-Source-Software, die auf der offiziellen Website verfügbar ist. Überprüfen Sie im Installationshandbuch für den Cloudera ODBC-Treiber die kompatible Version.
Cloudera ImpalaODBC-Treiber: Zum Herunterladen von der Cloudera-Website.
Hinweis: Wenn Ihre Umgebung bereits über einen ODBC-Manager verfügt, können Sie diesen verwenden und einfach die Impala-Konfiguration zu den vorhandenen Dateien hinzufügen.
Schritt 2: Installation des UnixODBC-Managers
Melden Sie sich auf dem CAS-Server-Controller als root-Benutzer an, um die Software zu extrahieren und zu kompilieren. In diesem Beispiel erfolgt die Installation im Verzeichnis /opt.
Terminal (Bash)
user@sas:~$$ gunzip unixODBC-2.3.4.tar.gz
user@sas:~$$ tar -xvf unixODBC-2.3.4.tar
Konfigurieren und kompilieren Sie anschließend UnixODBC:
Terminal (Bash)
user@sas:~$$ cd /opt/unixODBC-2.3.4
user@sas:~$$ ./configure --prefix=/opt/unixODBC-2.3.4 --disable-gui --disable-drivers
user@sas:~$$ make
Installieren Sie den RPM-Treiber mit einem YUM-Befehl. Standardmäßig erfolgt die Installation in /opt/cloudera/impalaodbc.
Terminal (Bash)
user@sas:~$$ cd /opt
user@sas:~$$ yum --nogpgcheck localinstall ClouderaImpalaODBC-2.5.35.1006-1.el7.x86
Schritt 4: Konfiguration der Verbindung zwischen Impala und UnixODBC
Nachdem beide Komponenten installiert sind, muss der UnixODBC-Treiber neu konfiguriert werden, um ImpalaODBC in seinen Suchpfad aufzunehmen.
Terminal (Bash)
user@sas:~$$ cd /opt/unixODBC-2.3.4
user@sas:~$$ export LD_LIBRARY_PATH=/opt/unixODBC-2.3.4/lib
user@sas:~$$ ./configure --prefix=/opt/cloudera/impalaodbc --with-unixodbc=/opt/unixODBC-2.3.4
user@sas:~$$ make
user@sas:~$$ make install
Schritt 5: Aktualisierung der Dateien odbc.ini und odbcinst.ini
Der Cloudera-Treiber stellt Beispieldateien .ini zur Verfügung, die sich in /opt/cloudera/impalaodbc/Setup/ befinden. Sie können diese Dateien direkt ändern oder an einen anderen Speicherort kopieren.
Der kritische Punkt ist die Aktualisierung der Datei odbc.ini mit den Informationen Ihres Hadoop-Clusters (Hostname und Port des Impala-Daemons).
Konfigurationsbeispiel für einen Cluster, bei dem der Daemon auf dem Standardport 21050 läuft:
/opt/cloudera/impalaodbc/Setup/RO
# Valeurs pour HOST, PORT, KrbFQDN, et KrbServiceName
HOST=sascdh01.race.sas.com
PORT=21050
Database=default
# Valeurs pour HOST, PORT, KrbFQDN, et KrbServiceName
Les codes et exemples fournis sur WeAreCAS.eu sont à but pédagogique. Il est impératif de ne pas les copier-coller aveuglément sur vos environnements de production. La meilleure approche consiste à comprendre la logique avant de l'appliquer. Nous vous recommandons vivement de tester ces scripts dans un environnement de test (Sandbox/Dev). WeAreCAS décline toute responsabilité quant aux éventuels impacts ou pertes de données sur vos systèmes.
SAS et tous les autres noms de produits ou de services de SAS Institute Inc. sont des marques déposées ou des marques de commerce de SAS Institute Inc. aux États-Unis et dans d'autres pays. ® indique un enregistrement aux États-Unis. WeAreCAS est un site communautaire indépendant et n'est pas affilié à SAS Institute Inc.
Ce site utilise des cookies techniques et analytiques pour améliorer votre expérience.
En savoir plus.