conditionalRandomFields crfScore

Hochvolumige Analyse von Produktbewertungen

Scénario de test & Cas d'usage

Geschäftskontext

Ein E-Commerce-Riese möchte Millionen von Kundenbewertungen in Echtzeit verarbeiten, um Produktmerkmale (z.B. 'Akkulaufzeit', 'Bildschirmqualität') zu identifizieren. Dieser Test validiert die Performance der `crfScore`-Aktion bei großen Datenmengen und die Stabilität der Speicherverwaltung.
Datenaufbereitung

Generierung eines großen Datensatzes mit 100.000 simulierten Bewertungen.

Kopiert!
1 
2DATA casuser.large_reviews;
3LENGTH text $100;
4DO i=1 to 100000;
5id=i;
6IF mod(i,2)=0 THEN text='Der Bildschirm ist fantastisch, aber der Akku ist schwach.';
7ELSE text='Schnelle Lieferung und toller Preis.';
8OUTPUT;
9END;
10 
11RUN;
12 

Étapes de réalisation

1
Ausführung des Scorings auf dem großen Datensatz unter Angabe des Zielparameters.
Kopiert!
1 
2PROC CAS;
3conditionalRandomFields.crfScore TABLE={name='large_reviews', caslib='casuser'} model={name='product_crf_model'} casOut={name='reviews_tagged', caslib='casuser', replace=true} target='feature_label';
4 
5RUN;
6 
7QUIT;
8 
2
Validierung der Anzahl der verarbeiteten Zeilen.
Kopiert!
1 
2PROC CAS;
3SIMPLE.numRows TABLE={name='reviews_tagged', caslib='casuser'};
4 
5RUN;
6 
7QUIT;
8 

Erwartetes Ergebnis


Die Aktion verarbeitet alle 100.000 Zeilen ohne Speicherfehler oder Zeitüberschreitung. Die Ausgabetabelle 'reviews_tagged' enthält exakt 100.000 Zeilen, und die Spalte 'feature_label' ist für alle Einträge gefüllt.