Veröffentlicht am :
ETL CREATION_INTERNE

PROC CASUTIL

Dieser Code ist auch verfügbar auf: English Español Français
Wartet auf Validierung
Attention : Dieser Code erfordert Administratorrechte.
Die CASUTIL-Prozedur ist ein unverzichtbares Werkzeug für die Datenverwaltung in der SAS© Cloud Analytic Services (CAS)-Umgebung. Sie ermöglicht es Benutzern, direkt mit Caslibs und CAS-Tabellen für Operationen wie das Anzeigen von Tabellendetails, das Löschen von Daten aus einer Quelle, das Entladen von Tabellen aus Caslibs, das Auflisten verfügbarer Tabellen, das Laden neuer Daten in Caslibs, das Promoten von Tabellen in den globalen Bereich, um sie für andere Sitzungen zugänglich zu machen, und das Speichern von CAS-Tabellen in externe Datenquellen zu interagieren. Das bereitgestellte Beispiel veranschaulicht das Laden einer CSV-Datei in eine CAS-Caslib.
Datenanalyse

Type : CREATION_INTERNE


Das Beispiel zeigt, wie eine lokale CSV-Datei ('County_Population.csv') in eine CAS-Caslib geladen wird, wodurch eine CAS-Tabelle aus externen Daten erstellt wird. Die Option IMPORTOPTIONS=(filetype="csv" getnames="true") wird verwendet, um den Dateityp anzugeben und sicherzustellen, dass die Spaltennamen korrekt importiert werden. Der Zugriff auf die Datenquelle erfolgt über eine Caslib vom Typ DNFS (Distributed Network File System).

1 Codeblock
PROC CASUTIL Data
Erklärung :
Dieser SAS-Code veranschaulicht den Prozess des Ladens einer CSV-Datei in SAS Cloud Analytic Services (CAS). Der erste Schritt besteht darin, eine Caslib namens 'csvfiles' vom Typ DNFS zu definieren, indem der Pfad zu den CSV-Dateien angegeben wird. Dies ermöglicht CAS den Zugriff auf die in diesem Verzeichnis gespeicherten Daten. Anschließend wird die PROC CASUTIL-Prozedur verwendet, um die in dieser Caslib verfügbaren Dateien aufzulisten (list files). Der Befehl 'load' wird dann verwendet, um die Datei 'County_Population.csv' in CAS zu laden. Die Option 'importoptions=(filetype="csv" getnames="true")' gibt an, dass die Datei im CSV-Format vorliegt und die erste Zeile die Variablennamen enthält. Die resultierende CAS-Tabelle wird 'county_population' genannt. Schließlich zeigt 'list tables' die derzeit in der Caslib geladenen CAS-Tabellen an.
Kopiert!
1caslib csvfiles task=add type=dnfs
2 path="/data/csv/"
3 desc="Spreadsheets and CSV source data.";
4
5PROC CASUTIL;
6 list files;
7 
8 load casdata="County_Population.csv"
9 importoptions=(filetype="csv" getnames="true")
10 casout="county_population";
11 
12 list tables;
13QUIT;
Dieses Material wird von We Are Cas "wie besehen" zur Verfügung gestellt. Es gibt keine ausdrücklichen oder stillschweigenden Garantien hinsichtlich der Marktgängigkeit oder Eignung für einen bestimmten Zweck in Bezug auf die hierin enthaltenen Materialien oder Codes. We Are Cas ist nicht verantwortlich für Fehler in diesem Material, wie es jetzt existiert oder existieren wird, noch bietet We Are Cas technischen Support dafür an.
Urheberrechtsinformationen : Copyright © SAS Institute Inc. All Rights Reserved.


Banner
Expertenrat
Expert
Stéphanie
Spécialiste Machine Learning et IA.
« PROC CASUTIL ist das „Schweizer Taschenmesser“ für die Verwaltung von Daten in der SAS Viya-Umgebung. Im Gegensatz zu herkömmlichen SAS-Prozeduren kommuniziert sie direkt mit dem CAS-Controller, um ressourcenintensive Aufgaben wie das Laden, Speichern und Verteilen von Tabellen zu koordinieren, ohne den lokalen SAS-Client zu belasten.

Um Ihre CAS-Infrastruktur optimal zu nutzen, beachten Sie diese Best Practices:

Serverseitiges Laden bevorzugen: Nutzen Sie die Anweisung LOAD CASDATA=, um Daten direkt von der Quelle (z. B. einem Pfad oder einer Datenbank) in den Arbeitsspeicher zu laden. Dies ist bei großen Datenmengen erheblich schneller als ein clientseitiger Upload, da die CAS-Worker die Daten parallel einlesen können.

Sichtbarkeit steuern (Promoting): Denken Sie daran, dass in CAS geladene Tabellen standardmäßig sitzungsgebunden sind. Verwenden Sie die Option PROMOTE, um Tabellen in den globalen Bereich zu heben, damit sie für andere Benutzer und Anwendungen (wie SAS Visual Analytics) dauerhaft verfügbar bleiben.

Metadaten-Kontrolle: Nutzen Sie LIST FILES, um physische Dateien in der Datenquelle zu prüfen, und LIST TABLES, um den aktuellen Status des In-Memory-Speichers zu überwachen. Dies hilft, redundante Ladevorgänge zu vermeiden und den Speicherverbrauch zu optimieren.

Strukturierte Ingestion: Verwenden Sie IMPORTOPTIONS, um beim Laden von CSV-Dateien Trennzeichen, Spaltennamen und Datentypen präzise zu definieren. Mit GETNAMES="TRUE" stellen Sie sicher, dass Ihre Variablen sofort korrekt benannt und für Analysen bereit sind. »