mbcScore - WeAreCAS

Q: Was ist der Hauptzweck der Aktion mbcScore?

Die Aktion mbcScore erzeugt Cluster-Gewichtungen unter Verwendung eines zuvor gespeicherten Modells.

Q: Welcher Parameter ist erforderlich, um die zu bewertende Eingabedatentabelle anzugeben?

Der Parameter 'table' ist ein Pflichtparameter, der die zu bewertende Eingabedatentabelle angibt.

Q: Wie gibt man das Modell an, das zum Bewerten verwendet werden soll?

Der Parameter 'restore' ist erforderlich, um den Item-Store anzugeben, der für die Bewertung verwendet werden soll.

Q: Welchem Zweck dient der Parameter 'casOut'?

Der Parameter 'casOut' ist ein Pflichtparameter, der die Ausgabetabelle für die Bewertungsergebnisse angibt.

Q: Wie kann ich alle Statistiken in die Ausgabetabelle aufnehmen?

Setzen Sie den Parameter 'allstats' auf TRUE, um alle verfügbaren Statistiken in die Ausgabetabelle aufzunehmen.

Beschreibung

Erzeugt Cluster-Gewichtungen unter Verwendung eines zuvor gespeicherten Modells.

mbc.mbcScore / allstats=TRUE | FALSE, casOut={caslib="string", compress=TRUE | FALSE, indexVars={"variable-name-1" <, "variable-name-2", ...>}, label="string", lifetime=64-bit-integer, maxMemSize=64-bit-integer, memoryFormat="DVR" | "INHERIT" | "STANDARD", name="table-name", promote=TRUE | FALSE, replace=TRUE | FALSE, replication=integer, tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE", threadBlockSize=64-bit-integer, timeStamp="string", where={"string-1" <, "string-2", ...>}}, copyVars="ALL" | "ALL_NUMERIC" | {"variable-name-1" <, "variable-name-2", ...>}, currClus="string", display={caseSensitive=TRUE | FALSE, exclude=TRUE | FALSE, excludeAll=TRUE | FALSE, keyIsPath=TRUE | FALSE, names={"string-1" <, "string-2", ...>}, pathType="LABEL" | "NAME", traceNames=TRUE | FALSE}, loglik="string", maxpost="string", nextClus="string", outputTables={groupByVarsRaw=TRUE | FALSE, includeAll=TRUE | FALSE, names={"string-1" <, "string-2", ...>} | {key-1={casouttable-1} <, key-2={casouttable-2}, ...>}, repeated=TRUE | FALSE, replace=TRUE | FALSE}, pred="string", restore={caslib="string", dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2, ...>}, name="table-name", whereTable={casLib="string", dataSourceOptions={adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", vars={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression"}}, role="string", table={caslib="string", computedOnDemand=TRUE | FALSE, computedVars={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, computedVarsProgram="string", dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2, ...>}, groupBy={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, groupByMode="NOSORT" | "REDISTRIBUTE", importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", orderBy={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, singlePass=TRUE | FALSE, vars={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression", whereTable={casLib="string", dataSourceOptions={adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", vars={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression"}};

Einstellungen

Parameter	Beschreibung
allstats	Wenn auf True gesetzt, werden alle Statistiken zur Ausgabetabelle hinzugefügt.
casOut	Gibt die Einstellungen für eine Ausgabetabelle an.
copyVars	Gibt eine Liste von einer oder mehreren Variablen an, die von der Eingabetabelle in die Ausgabetabelle kopiert werden sollen. Sie können alternativ den Wert ALL oder ALL_NUMERIC angeben, der jeweils alle Variablen oder alle numerischen Variablen aus der Eingabetabelle in die Ausgabetabelle kopiert.
currClus	Gibt ein Präfix für die Benennung der Schätzungen der Cluster-Mitgliedschaftswahrscheinlichkeit aus dem Erwartungsschritt (E-Schritt) an, der die Mittelwert- und Kovarianzschätzungen im abschließenden Maximierungsschritt (M-Schritt) erzeugt hat.
display	Gibt eine Liste von Ergebnistabellen an, die zur Anzeige an den Client gesendet werden sollen.
loglik	Gibt ein Präfix für die Benennung der Cluster-Log-Likelihoods an.
maxpost	Gibt ein Präfix für die Benennung des Clusters mit der maximalen A-posteriori-Wahrscheinlichkeit an.
nextClus	Gibt ein Präfix für die Benennung der Schätzungen der Cluster-Mitgliedschaftswahrscheinlichkeit aus einem zusätzlichen Erwartungsschritt (E-Schritt) an, der die Mittelwert- und Kovarianzschätzungen aus dem abschließenden Maximierungsschritt (M-Schritt) verwendet.
outputTables	Listet die Namen der Ergebnistabellen auf, die als CAS-Tabellen auf dem Server gespeichert werden sollen.
pred	Gibt ein Präfix für die Benennung der vorhergesagten Werte an.
restore	Gibt den zu verwendenden Item-Store für das Scoring an.
role	Gibt den Namen für die Spalte an, die die Beobachtungsrolle enthält.
table	Gibt die Eingabedatentabelle an.

Datenaufbereitung Datenaufbereitungsblatt ansehen

Datenerstellung

Dieser Schritt erstellt eine Beispieltabelle `mycas.score_data` mit Beobachtungen, die bewertet werden sollen. Die Variablen `x1` und `x2` werden für das Scoring verwendet. Das Modell muss zuvor mit der Aktion `mbcFit` erstellt und in `mycas.my_model` gespeichert worden sein.

Kopiert!

1	DATA mycas.score_data;
2	INPUT x1 x2;
3	DATALINES;
4	1.0 2.5
5	1.2 2.9
6	5.0 5.5
7	5.2 5.9
8	;
9	RUN;

Beispiele

Dieses Beispiel zeigt, wie die Aktion `mbcScore` verwendet wird, um eine neue Tabelle mit den Cluster-Gewichten zu erstellen, basierend auf einem zuvor gespeicherten Modell in `mycas.my_model`.

SAS® / CAS-Code Code wartet auf Validierung durch die Community

Kopiert!

1	PROC CAS;
2	mbc.mbcScore /
3	restore={name='my_model' caslib='mycas'},
4	TABLE={name='score_data' caslib='mycas'},
5	casOut={name='scored_output' caslib='mycas' replace=true};
6	RUN;
7	QUIT;

Ergebnis :
Die Aktion erzeugt eine Ausgabetabelle `mycas.scored_output`, die die ursprünglichen Daten sowie die Scoring-Ergebnisse enthält, wie z.B. Cluster-Zugehörigkeitswahrscheinlichkeiten.

Dieses Beispiel führt ein Scoring für die Tabelle `score_data` durch. Es werden alle verfügbaren Statistiken berechnet (`allstats=true`). Die Parameter `currClus`, `loglik` und `maxpost` werden verwendet, um die Namen der Ausgabespalten für die Clusterwahrscheinlichkeiten, die Log-Likelihood und den Cluster mit der höchsten A-posteriori-Wahrscheinlichkeit festzulegen. Die ursprünglichen Variablen werden ebenfalls in die Ausgabetabelle `scored_output_detailed` kopiert.

SAS® / CAS-Code Code wartet auf Validierung durch die Community

Kopiert!

1	PROC CAS;
2	mbc.mbcScore /
3	restore={name='my_model' caslib='mycas'},
4	TABLE={name='score_data' caslib='mycas'},
5	allstats=true,
6	copyVars={'x1', 'x2'},
7	currClus='prob_',
8	loglik='loglik_',
9	maxpost='max_post_cluster',
10	casOut={name='scored_output_detailed' caslib='mycas' replace=true};
11	RUN;
12	QUIT;

Ergebnis :
Erstellt die Tabelle `mycas.scored_output_detailed`, die `x1`, `x2`, die Cluster-Wahrscheinlichkeiten (mit dem Präfix 'prob_'), die Log-Likelihoods (mit dem Präfix 'loglik_') und die Spalte `max_post_cluster` mit der wahrscheinlichsten Cluster-Zuweisung enthält.

FAQ

Was ist der Hauptzweck der Aktion mbcScore?

Welcher Parameter ist erforderlich, um die zu bewertende Eingabedatentabelle anzugeben?

Wie gibt man das Modell an, das zum Bewerten verwendet werden soll?

Welchem Zweck dient der Parameter 'casOut'?

Wie kann ich alle Statistiken in die Ausgabetabelle aufnehmen?

Actions associées

mbc

mbcFit

Führt modellbasiertes Clustering mit dem EM-Algorithmus durch.

Inhaltsverzeichnis

Beschreibung

Datenerstellung

Beispiele

Einfaches Scoring-Beispiel

Detailliertes Scoring mit zusätzlichen Statistiken

FAQ

Actions associées

mbcFit