sequence cspade

Analyse klinischer Pfade mit Längenbeschränkung

Scénario de test & Cas d'usage

Geschäftskontext

Ein Krankenhaus untersucht Behandlungsabfolgen für eine seltene Krankheit. Da die Daten spärlich sind, verwenden wir eine absolute Anzahl (supportCnt) statt Prozentwerten. Zudem interessieren uns nur kurze Behandlungsketten (maxLen), um die primäre Reaktion zu isolieren.
Datenaufbereitung

Datensatz mit Patientenbehandlungen. Einige Patienten haben sehr lange Historien, die gekürzt werden sollen.

Kopiert!
1DATA casuser.medical_path; INPUT pat_id week treat $; DATALINES;
21 1 A
31 2 B
41 3 C
51 4 D
61 5 E
72 1 A
82 3 B
93 1 B
103 2 C
114 1 A
124 2 B
134 6 D
14; RUN;

Étapes de réalisation

1
Ausführung mit 'supportCnt' (absolute Anzahl) statt Prozent und Begrenzung der Sequenzlänge auf 2.
Kopiert!
1 
2PROC CAS;
3sequence.cspade / TABLE={name="medical_path"} sequenceId="pat_id" eventId="week" itemId="treat" supportCnt=2 maxLen=2 casout={name="short_paths", replace=true};
4 
5RUN;
6 
2
Überprüfung, dass keine Sequenzen länger als 2 Elemente in der Ausgabe sind.
Kopiert!
1 
2PROC CAS;
3SIMPLE.freq / TABLE={name="short_paths"} inputs={"Size"};
4 
5RUN;
6 

Erwartetes Ergebnis


Die Tabelle 'short_paths' darf keine Sequenzen mit mehr als 2 Elementen enthalten (z.B. wird 'A->B->C' gefiltert oder gekürzt). Sequenzen wie 'A->B' sollten erscheinen, da sie bei Patienten 1, 2 und 4 vorkommen (Count >= 2).