Expertenrat
Stéphanie
Spécialiste Machine Learning et IA.
« PROC CASUTIL ist das „Schweizer Taschenmesser“ für die Verwaltung von Daten in der SAS Viya-Umgebung. Im Gegensatz zu herkömmlichen SAS-Prozeduren kommuniziert sie direkt mit dem CAS-Controller, um ressourcenintensive Aufgaben wie das Laden, Speichern und Verteilen von Tabellen zu koordinieren, ohne den lokalen SAS-Client zu belasten.
Um Ihre CAS-Infrastruktur optimal zu nutzen, beachten Sie diese Best Practices:
Serverseitiges Laden bevorzugen: Nutzen Sie die Anweisung LOAD CASDATA=, um Daten direkt von der Quelle (z. B. einem Pfad oder einer Datenbank) in den Arbeitsspeicher zu laden. Dies ist bei großen Datenmengen erheblich schneller als ein clientseitiger Upload, da die CAS-Worker die Daten parallel einlesen können.
Sichtbarkeit steuern (Promoting): Denken Sie daran, dass in CAS geladene Tabellen standardmäßig sitzungsgebunden sind. Verwenden Sie die Option PROMOTE, um Tabellen in den globalen Bereich zu heben, damit sie für andere Benutzer und Anwendungen (wie SAS Visual Analytics) dauerhaft verfügbar bleiben.
Metadaten-Kontrolle: Nutzen Sie LIST FILES, um physische Dateien in der Datenquelle zu prüfen, und LIST TABLES, um den aktuellen Status des In-Memory-Speichers zu überwachen. Dies hilft, redundante Ladevorgänge zu vermeiden und den Speicherverbrauch zu optimieren.
Strukturierte Ingestion: Verwenden Sie IMPORTOPTIONS, um beim Laden von CSV-Dateien Trennzeichen, Spaltennamen und Datentypen präzise zu definieren. Mit GETNAMES="TRUE" stellen Sie sicher, dass Ihre Variablen sofort korrekt benannt und für Analysen bereit sind. »