conditionalRandomFields

crfScore

Beschreibung

Bewertet Dokumente anhand eines CRF-Modells (Conditional Random Fields). Diese Aktion verwendet ein trainiertes CRF-Modell, um Sequenzen von Tokens in Eingabedokumenten zu kennzeichnen und die wahrscheinlichste Sequenz von Labels für jede Sequenz von Tokens vorherzusagen.

conditionalRandomFields.crfScore result=<results> status=<rc> / casOut={<casouttable>} model={<crfmodel>} table={<castable>} target="string";
Einstellungen
ParameterBeschreibung
casOutGibt die CAS-Tabelle an, die die getaggten Ausgabedaten enthalten soll.
modelGibt die Eingabemodellierungstabellen an, die das trainierte CRF-Modell definieren.
tableGibt den Namen der CAS-Tabelle an, die die zu bewertenden Eingabedaten enthält.
targetGibt den Namen der vorhergesagten/versteckten Variable in der Ausgabetabelle an.
Datenerstellung

Dieses Beispiel zeigt, wie eine Eingabetabelle für das Scoring erstellt wird. Die Tabelle 'score_data' enthält eine ID und den Text, der bewertet werden soll. Diese Tabelle wird dann in die Caslib 'casuser' geladen.

Kopiert!
1DATA casuser.score_data;
2 LENGTH text $200;
3 INFILE DATALINES delimiter='|';
4 INPUT id text$;
5 DATALINES;
61|SAS is a company based in Cary, NC.
72|John works at SAS.
8;
9RUN;

Beispiele

Dieses Beispiel zeigt, wie die Aktion `crfScore` verwendet wird, um eine Eingabetabelle mit einem vorhandenen CRF-Modell zu bewerten. Das Modell wird aus den Tabellen 'crf_model_attr', 'crf_model_label', 'crf_model_feature', 'crf_model_template' und 'crf_model_attr_feature' geladen. Die bewerteten Ergebnisse werden in der Tabelle 'crf_scored' gespeichert.

SAS® / CAS-Code Code wartet auf Validierung durch die Community
Kopiert!
1PROC CAS;
2 conditionalRandomFields.crfScore
3 TABLE={name='score_data'},
4 model={name='crf_model'},
5 casOut={name='crf_scored', replace=true},
6 target='predicted_label';
7RUN;
8QUIT;
Ergebnis :
Die Aktion erstellt eine Ausgabetabelle namens 'crf_scored' in der aktuellen Caslib. Diese Tabelle enthält die ursprünglichen Daten aus 'score_data' sowie eine neue Spalte namens 'predicted_label', die die vom CRF-Modell zugewiesenen Labels für jedes Token enthält.

Dieses Beispiel zeigt einen detaillierteren Aufruf der Aktion `crfScore`, bei dem jede Komponente des CRF-Modells explizit über separate Tabellen ('labels', 'attrs', 'features', 'attr_features', 'templates') angegeben wird. Die Eingabedaten stammen aus der Tabelle 'test_data', und die Ausgabe wird in die Tabelle 'scored_output' in der Caslib 'casuser' geschrieben, wobei alle vorhandenen Tabellen mit demselben Namen ersetzt werden.

SAS® / CAS-Code Code wartet auf Validierung durch die Community
Kopiert!
1PROC CAS;
2 conditionalRandomFields.crfScore
3 TABLE={name='test_data' caslib='casuser'},
4 model={
5 label={name='labels'},
6 attr={name='attrs'},
7 feature={name='features'},
8 attrfeature={name='attr_features'},
9 template={name='templates'}
10 },
11 casOut={name='scored_output', caslib='casuser', replace=true},
12 target='predicted_entity';
13RUN;
14QUIT;
Ergebnis :
Die Ausgabetabelle 'scored_output' wird in der Caslib 'casuser' erstellt. Sie enthält die Spalten aus der Tabelle 'test_data' sowie die Spalte 'predicted_entity', die die vom Modell vorhergesagten Entitäts-Tags für die Textsequenzen enthält. Bestehende Tabellen mit demselben Namen werden überschrieben.

FAQ

Was ist der Zweck der `crfScore`-Aktion?
Welche Eingabeparameter sind für die `crfScore`-Aktion zwingend erforderlich?
Was gibt der `target`-Parameter an?
Welche Tabellen müssen innerhalb des `model`-Parameters bereitgestellt werden?