conditionalRandomFields

crfScore

Beschreibung

Bewertet Dokumente anhand eines CRF-Modells (Conditional Random Fields). Diese Aktion verwendet ein trainiertes CRF-Modell, um Sequenzen von Tokens in Eingabedokumenten zu kennzeichnen und die wahrscheinlichste Sequenz von Labels für jede Sequenz von Tokens vorherzusagen.

conditionalRandomFields.crfScore result=<results> status=<rc> / casOut={<casouttable>} model={<crfmodel>} table={<castable>} target="string";
Einstellungen
ParameterBeschreibung
casOutGibt die CAS-Tabelle an, die die getaggten Ausgabedaten enthalten soll.
modelGibt die Eingabemodellierungstabellen an, die das trainierte CRF-Modell definieren.
tableGibt den Namen der CAS-Tabelle an, die die zu bewertenden Eingabedaten enthält.
targetGibt den Namen der vorhergesagten/versteckten Variable in der Ausgabetabelle an.
Datenerstellung

Dieses Beispiel zeigt, wie eine Eingabetabelle für das Scoring erstellt wird. Die Tabelle 'score_data' enthält eine ID und den Text, der bewertet werden soll. Diese Tabelle wird dann in die Caslib 'casuser' geladen.

Kopiert!
1DATA casuser.score_data;
2 LENGTH text $200;
3 INFILE DATALINES delimiter='|';
4 INPUT id text$;
5 DATALINES;
61|SAS is a company based in Cary, NC.
72|John works at SAS.
8;
9RUN;

Beispiele

Dieses Beispiel zeigt, wie die Aktion `crfScore` verwendet wird, um eine Eingabetabelle mit einem vorhandenen CRF-Modell zu bewerten. Das Modell wird aus den Tabellen 'crf_model_attr', 'crf_model_label', 'crf_model_feature', 'crf_model_template' und 'crf_model_attr_feature' geladen. Die bewerteten Ergebnisse werden in der Tabelle 'crf_scored' gespeichert.

SAS® / CAS-Code Code wartet auf Validierung durch die Community
Kopiert!
1PROC CAS;
2 conditionalRandomFields.crfScore
3 TABLE={name='score_data'},
4 model={name='crf_model'},
5 casOut={name='crf_scored', replace=true},
6 target='predicted_label';
7RUN;
8QUIT;
Ergebnis :
Die Aktion erstellt eine Ausgabetabelle namens 'crf_scored' in der aktuellen Caslib. Diese Tabelle enthält die ursprünglichen Daten aus 'score_data' sowie eine neue Spalte namens 'predicted_label', die die vom CRF-Modell zugewiesenen Labels für jedes Token enthält.

Dieses Beispiel zeigt einen detaillierteren Aufruf der Aktion `crfScore`, bei dem jede Komponente des CRF-Modells explizit über separate Tabellen ('labels', 'attrs', 'features', 'attr_features', 'templates') angegeben wird. Die Eingabedaten stammen aus der Tabelle 'test_data', und die Ausgabe wird in die Tabelle 'scored_output' in der Caslib 'casuser' geschrieben, wobei alle vorhandenen Tabellen mit demselben Namen ersetzt werden.

SAS® / CAS-Code Code wartet auf Validierung durch die Community
Kopiert!
1PROC CAS;
2 conditionalRandomFields.crfScore
3 TABLE={name='test_data' caslib='casuser'},
4 model={
5 label={name='labels'},
6 attr={name='attrs'},
7 feature={name='features'},
8 attrfeature={name='attr_features'},
9 template={name='templates'}
10 },
11 casOut={name='scored_output', caslib='casuser', replace=true},
12 target='predicted_entity';
13RUN;
14QUIT;
Ergebnis :
Die Ausgabetabelle 'scored_output' wird in der Caslib 'casuser' erstellt. Sie enthält die Spalten aus der Tabelle 'test_data' sowie die Spalte 'predicted_entity', die die vom Modell vorhergesagten Entitäts-Tags für die Textsequenzen enthält. Bestehende Tabellen mit demselben Namen werden überschrieben.

FAQ

Was ist der Zweck der `crfScore`-Aktion?
Welche Eingabeparameter sind für die `crfScore`-Aktion zwingend erforderlich?
Was gibt der `target`-Parameter an?
Welche Tabellen müssen innerhalb des `model`-Parameters bereitgestellt werden?

Zugehörige Szenarien

Anwendungsfall
Extraktion medizinischer Entitäten aus Arztbriefen

Ein Krankenhaus möchte unstrukturierte Arztbriefe automatisch analysieren, um Medikamente und Dosierungen zu extrahieren. Ziel ist es, die Patientensicherheit zu erhöhen und die...

Anwendungsfall
Hochvolumige Analyse von Produktbewertungen

Ein E-Commerce-Riese möchte Millionen von Kundenbewertungen in Echtzeit verarbeiten, um Produktmerkmale (z.B. 'Akkulaufzeit', 'Bildschirmqualität') zu identifizieren. Dieser Tes...

Anwendungsfall
Fehleranalyse in IT-Logs mit expliziter Modellstruktur

Ein Cybersecurity-Team analysiert Server-Logs, um Sicherheitsvorfälle zu erkennen. Da das Modell sehr komplex ist, werden die Modellkomponenten (Attribute, Features, Templates) ...