conditionalRandomFields

crfTrain

Beschreibung

Die Aktion `crfTrain` trainiert ein Modell für bedingte Zufallsfelder (Conditional Random Fields, CRF) zur Sequenzkennzeichnung. CRFs sind eine Klasse statistischer Modellierungsmethoden, die häufig für die strukturierte Vorhersage verwendet werden, bei der benachbarte Ausgaben voneinander abhängig sind, wie z. B. bei der Kennzeichnung von Wortarten in einem Satz. Diese Aktion ist besonders nützlich für Aufgaben wie die Erkennung benannter Entitäten (Named Entity Recognition, NER).

conditionalRandomFields.crfTrain <result=results> <status=rc> / model={...} nloOpts={...} table={...} target="string" template="string";
Einstellungen
ParameterBeschreibung
modelGibt die Ausgabemodellierungstabellen an.
nloOptsGibt die Parameter für die nichtlineare Optimierung (OPTML) an.
tableGibt den Namen der CAS-Tabelle an, die die Eingabedaten enthält.
targetGibt den Namen der vorhergesagten/versteckten Variable der Eingabetabelle an.
templateGibt die textuelle Vorlage zum Extrahieren von Merkmalen an.

Beispiele

Die bereitgestellte HTML-Dokumentation enthält keine direkt einbettbaren Codebeispiele. Ein Beispiel ist über einen externen Link verfügbar.

SAS® / CAS-Code Code wartet auf Validierung durch die Community
Kopiert!

Die bereitgestellte HTML-Dokumentation enthält keine direkt einbettbaren detaillierten Codebeispiele. Ein Beispiel ist über einen externen Link verfügbar.

SAS® / CAS-Code Code wartet auf Validierung durch die Community
Kopiert!

FAQ

Was ist der Zweck der `crfTrain`-Aktion?
Welche Parameter sind für die `crfTrain`-Aktion erforderlich?
Was gibt der `model`-Parameter an?
Welche Optimierungsalgorithmen können mit `crfTrain` verwendet werden?
Was ist die Funktion des `template`-Parameters?
Wie kann ich die Regularisierung für das Modell steuern?

Zugehörige Szenarien

Anwendungsfall
Training zur Erkennung benannter Entitäten in medizinischen Berichten

Ein Krankenhaus möchte automatisch Symptome und Medikamente aus unstrukturierten Arztbriefen extrahieren. Das Ziel ist es, ein CRF-Modell zu trainieren, das Wörter als 'B-SYMP' ...

Anwendungsfall
Optimierung der Produktkategorisierung mit SGD und Regularisierung

Ein E-Commerce-Riese muss Millionen von Suchanfragen verarbeiten, um Produktattribute (Farbe, Marke, Größe) zu taggen. Da die Datenmenge riesig ist, wird der 'Stochastic Gradien...

Anwendungsfall
Validierung komplexer Templates und Vollständigkeit der Modellartefakte

Ein Linguistik-Forschungsinstitut entwickelt ein Modell für eine seltene Sprache, das komplexe morphologische Regeln beachtet. Der Test soll sicherstellen, dass spezifische, kom...