modelPublishing copyModelExternal

Performance-Test: Extraktion eines spezifischen Modells aus großem Bestand für Hadoop

Scénario de test & Cas d'usage

Geschäftskontext

Ein Industrieunternehmen für IoT-Sensoren verwaltet Tausende von Vorhersagemodellen (eines pro Maschinentyp) in einer einzigen, massiven CAS-Tabelle. Für eine historische Analyse im Data Lake muss ein spezifisches, komplexes Modell ('Turbine_X99') effizient aus diesem großen Bestand isoliert und in einen Hadoop-Cluster exportiert werden. Der Test prüft, ob die Aktion auch bei hohem Datenvolumen das richtige Modell korrekt filtert und überträgt.
Datenaufbereitung

Generierung von 1000 Dummy-Modellen, wobei eines das Zielmodell ist.

Kopiert!
1 
2DATA casuser.all_iot_models;
3LENGTH ModelName $32 ModelContent $1000;
4DO i=1 to 1000;
5ModelName=cats('MachineModel_', i);
6ModelContent='Example content for machine ' || cats(i);
7OUTPUT;
8END;
9ModelName='Turbine_X99';
10ModelContent='Complex Logic for Turbine X99...';
11OUTPUT;
12 
13RUN;
14 

Étapes de réalisation

1
Validierung der Anzahl der Modelle in der Quelltabelle.
Kopiert!
1 
2PROC CAS;
3SIMPLE.numRows / TABLE={caslib="casuser", name="all_iot_models"};
4 
5RUN;
6 
2
Gezielter Export nur des Modells 'Turbine_X99' nach Hadoop.
Kopiert!
1 
2PROC CAS;
3ACTION modelPublishing.copyModelExternal / modelTable={caslib="casuser", name="all_iot_models"} modelName="Turbine_X99" externalCaslib="HadoopLake" externalOptions={extType="HADOOP", modelDatabase="archive_models"};
4 
5RUN;
6 

Erwartetes Ergebnis


Trotz der Größe der Quelltabelle wird ausschließlich das Modell 'Turbine_X99' in Hadoop erstellt. Die anderen 1000 Modelle werden ignoriert. Die Performance ist akzeptabel und das Zielsystem enthält den korrekten Modellinhalt.