Scénario de test & Cas d'usage
Datenbereinigung, Imputation und Vorverarbeitung.
Entdecken Sie alle Aktionen von dataPreprocessSimulation von 50.000 Web-Sitzungsprotokollen.
| 1 | |
| 2 | DATA casuser.web_logs; |
| 3 | LENGTH device $10 browser_lang $5; |
| 4 | DO i=1 to 50000; |
| 5 | IF rand('UNIFORM') < 0.7 THEN device='Mobile'; |
| 6 | ELSE device='Desktop'; |
| 7 | IF rand('UNIFORM') < 0.8 THEN browser_lang='DE'; |
| 8 | ELSE browser_lang='EN'; |
| 9 | OUTPUT; |
| 10 | END; |
| 11 | |
| 12 | RUN; |
| 13 |
| 1 | |
| 2 | PROC CAS; |
| 3 | |
| 4 | TABLE.tableInfo / TABLE={name='web_logs', caslib='casuser'}; |
| 5 | |
| 6 | |
| 7 | RUN; |
| 8 |
| 1 | PROC CAS; |
| 2 | dataPreprocess.catTrans / |
| 3 | TABLE={name='web_logs', caslib='casuser'}, |
| 4 | method='ONEHOT', |
| 5 | inputs={{name='device'}, {name='browser_lang'}}, |
| 6 | casOut={name='onehot_logs', caslib='casuser', replace=true}, |
| 7 | outVarsNamePrefix='OH_', |
| 8 | evaluationStats=false; |
| 9 | RUN; |
Die Tabelle 'onehot_logs' wird generiert und enthält für jede Ausprägung von 'device' und 'browser_lang' eine eigene Spalte (z.B. OH_device_Mobile, OH_browser_lang_DE) mit den Werten 0 oder 1.