SAS Viya et Hadoop : Résoudre l'erreur de connexion TimeoutException lors de la création d'une Caslib
Simon 15 Aufrufe
Schwierigkeitsgrad
Confirmé
Veröffentlicht am :
Expertenrat
Michael
Dans l'architecture Viya, la configuration la plus simple est souvent la plus stable. Laissez les fichiers de configuration Hadoop servir de "source de vérité" unique.
Avant de paniquer face à un timeout, suivez cet ordre de diagnostic :
- Vérifiez les chemins : Est-ce que les dossiers hadoopjarpath et hadoopconfigdir sont accessibles par tous les nœuds CAS (et pas seulement le contrôleur) ?
- Simplifiez : Supprimez l'option uri et testez.
- Vérifiez le réseau : Les ports 2181 (Zookeeper) et 10000 (Hive) sont-ils ouverts entre le cluster CAS et le cluster Hadoop ?
Lors de l'exécution d'une instruction CASLIB pour se connecter à Hadoop (souvent via Hive), le processus s'arrête et renvoie les messages d'erreur suivants dans le journal (log) :
ERROR: The connection to the data source driver failed.
ERROR: General error java.util.concurrent.TimeoutException
ERROR: Function failed.
ERROR: The action stopped due to errors.
Ce problème survient généralement lors de l'utilisation d'une chaîne de connexion explicite incluant l'option uri=, comme dans l'exemple ci-dessous :
/* Code provoquant l'erreur */
caslib hdlib datasource=(
srctype="hadoop",
dataTransferMode="serial",
username="{votre_user}",
password="{votre_mdp}",
/* L'option URI ci-dessous est souvent la cause du conflit */
uri="jdbc:hive2://{host}:2181...;serviceDiscoveryMode=zooKeeper;...",
hadoopjarpath="/sas_mirror/hadoopfiles/lib",
hadoopconfigdir="/sas_mirror/hadoopfiles/conf",
schema="default"
);
1
/* Code provoquant l'erreur */
2
caslib hdlib datasource=(
3
srctype="hadoop",
4
dataTransferMode="serial",
5
username="{votre_user}",
6
password="{votre_mdp}",
7
/* L'option URI ci-dessous est souvent la cause du conflit */
Astuce supplémentaire : Gérer la lenteur du cluster
Si, après avoir appliqué la correction ci-dessus, vous rencontrez toujours des erreurs de timeout (notamment sur des clusters très sollicités), il est possible que le délai par défaut soit trop court.
Le délai de connexion par défaut pour Hadoop est généralement de 30 secondes. Vous pouvez augmenter cette valeur en ajoutant l'option login_timeout :
caslib hdlib datasource=(
...
login_timeout=60 /* Augmentation du délai à 60 secondes */
...
);
1
caslib hdlib datasource=(
2
...
3
login_timeout=60/* Augmentation du délai à 60 secondes */
4
...
5
);
Wichtiger Haftungsausschluss
Die auf WeAreCAS.eu bereitgestellten Codes und Beispiele dienen Lehrzwecken. Es ist zwingend erforderlich, sie nicht blind in Ihre Produktionsumgebungen zu kopieren. Der beste Ansatz besteht darin, die Logik zu verstehen, bevor sie angewendet wird. Wir empfehlen dringend, diese Skripte in einer Testumgebung (Sandbox/Dev) zu testen. WeAreCAS übernimmt keine Verantwortung für mögliche Auswirkungen oder Datenverluste auf Ihren Systemen.
SAS und alle anderen Produkt- oder Dienstleistungsnamen von SAS Institute Inc. sind eingetragene Marken oder Marken von SAS Institute Inc. in den USA und anderen Ländern. ® zeigt die Registrierung in den USA an. WeAreCAS ist eine unabhängige Community-Site und nicht mit SAS Institute Inc. verbunden.
Diese Website verwendet technische und analytische Cookies, um Ihre Erfahrung zu verbessern.
Mehr erfahren.