Scénario de test & Cas d'usage
Datensatz mit Patientenbehandlungen. Einige Patienten haben sehr lange Historien, die gekürzt werden sollen.
| 1 | DATA casuser.medical_path; INPUT pat_id week treat $; DATALINES; |
| 2 | 1 1 A |
| 3 | 1 2 B |
| 4 | 1 3 C |
| 5 | 1 4 D |
| 6 | 1 5 E |
| 7 | 2 1 A |
| 8 | 2 3 B |
| 9 | 3 1 B |
| 10 | 3 2 C |
| 11 | 4 1 A |
| 12 | 4 2 B |
| 13 | 4 6 D |
| 14 | ; RUN; |
| 1 | |
| 2 | PROC CAS; |
| 3 | sequence.cspade / TABLE={name="medical_path"} sequenceId="pat_id" eventId="week" itemId="treat" supportCnt=2 maxLen=2 casout={name="short_paths", replace=true}; |
| 4 | |
| 5 | RUN; |
| 6 |
| 1 | |
| 2 | PROC CAS; |
| 3 | SIMPLE.freq / TABLE={name="short_paths"} inputs={"Size"}; |
| 4 | |
| 5 | RUN; |
| 6 |
Die Tabelle 'short_paths' darf keine Sequenzen mit mehr als 2 Elementen enthalten (z.B. wird 'A->B->C' gefiltert oder gekürzt). Sequenzen wie 'A->B' sollten erscheinen, da sie bei Patienten 1, 2 und 4 vorkommen (Count >= 2).