Scénario de test & Cas d'usage
Erstellung von Daten mit vielfältigen lexikalischen Mustern.
| 1 | DATA casuser.linguistic_data; LENGTH morph $20 pos $5; INPUT id morph $ pos $; CARDS; |
| 2 | 1 ge-lauf-en VVPP |
| 3 | 1 das ART |
| 4 | 1 Haus NN |
| 5 | 2 ge-seh-en VVPP |
| 6 | 2 der ART |
| 7 | 2 Mann NN |
| 8 | ; RUN; |
| 1 | /* Template prüft aktuelles Wort, Wort davor und danach */ |
| 2 | %let complex_template = %str(type:CRF_PP |
| 3 | feature:U01:%x[0,0] |
| 4 | feature:U02:%x[-1,0] |
| 5 | feature:U03:%x[1,0] |
| 6 | feature:B); |
| 1 | PROC CAS; |
| 2 | conditionalRandomFields.crfTrain / |
| 3 | TABLE={name='linguistic_data'} |
| 4 | target='pos' |
| 5 | template="&complex_template" |
| 6 | model={ |
| 7 | label={name='model_labels'}, |
| 8 | attr={name='model_attrs'}, |
| 9 | feature={name='model_features'}, |
| 10 | attrfeature={name='model_attr_feat'}, |
| 11 | template={name='model_template_out'} |
| 12 | }; |
| 13 | QUIT; |
| 1 | |
| 2 | PROC CAS; |
| 3 | TABLE.tableInfo / caslib='casuser' wild='model_*'; |
| 4 | QUIT; |
| 5 |
Alle 5 angeforderten Modelltabellen (labels, attrs, features, attrfeature, template_out) werden in der Caslib erstellt. Die Tabelle 'model_template_out' enthält die geparste Version des komplexen Eingabe-Templates.