Scénario de test & Cas d'usage
Automatisiertes maschinelles Lernen (AutoML) und Pipeline-Generierung.
Entdecken Sie alle Aktionen von dataSciencePilotErstellung eines Datensatzes für eine klinische Studie mit verschiedenen komplexen Mustern fehlender Werte, einschließlich vollständig leerer Zeilen, die Studienabbrecher repräsentieren.
| 1 | DATA mycas.STUDIEN_DATEN; |
| 2 | INPUT Patienten_ID $ Biomarker_A Biomarker_B Nebenwirkung_Grad $ Behandlungserfolg; |
| 3 | DATALINES; |
| 4 | P01 1.23 45.1 MILD 1 |
| 5 | P02 1.45 . SCHWER 0 |
| 6 | P03 . 33.9 MILD 1 |
| 7 | P04 2.11 50.2 . 1 |
| 8 | P05 . . . . |
| 9 | P06 0.98 29.5 KEINE 1 |
| 10 | P07 . . SCHWER 0 |
| 11 | P08 . . . . |
| 12 | ; |
| 13 | RUN; |
| 1 | PROC CAS; |
| 2 | dataSciencePilot.analyzeMissingPatterns |
| 3 | TABLE={name='STUDIEN_DATEN'}, |
| 4 | inputs={'Biomarker_A', 'Biomarker_B', 'Nebenwirkung_Grad'}, |
| 5 | casOut={name='clinical_patterns_base', replace=true}; |
| 6 | RUN; |
| 7 | QUIT; |
| 1 | PROC CAS; |
| 2 | dataSciencePilot.analyzeMissingPatterns |
| 3 | TABLE={name='STUDIEN_DATEN'}, |
| 4 | inputs={'Biomarker_A', 'Biomarker_B', 'Nebenwirkung_Grad'}, |
| 5 | target='Behandlungserfolg', |
| 6 | casOut={name='clinical_patterns_target', replace=true}; |
| 7 | RUN; |
| 8 | QUIT; |
Die Tabelle 'clinical_patterns_base' soll das Muster, bei dem 'Biomarker_A', 'Biomarker_B' und 'Nebenwirkung_Grad' alle fehlen, korrekt identifizieren und seine Häufigkeit (2) angeben. Die Tabelle 'clinical_patterns_target' soll zeigen, dass für dieses spezifische 'Dropout'-Muster auch die Zielvariable 'Behandlungserfolg' immer fehlt. Dies bestätigt die Fähigkeit der Aktion, extreme Fälle von fehlenden Werten zu behandeln und deren Beziehung zu Ergebnisvariablen aufzuzeigen.