mbc

mbcScore

Beschreibung

Erzeugt Cluster-Gewichtungen unter Verwendung eines zuvor gespeicherten Modells.

mbc.mbcScore / allstats=TRUE | FALSE, casOut={caslib="string", compress=TRUE | FALSE, indexVars={"variable-name-1" <, "variable-name-2", ...>}, label="string", lifetime=64-bit-integer, maxMemSize=64-bit-integer, memoryFormat="DVR" | "INHERIT" | "STANDARD", name="table-name", promote=TRUE | FALSE, replace=TRUE | FALSE, replication=integer, tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE", threadBlockSize=64-bit-integer, timeStamp="string", where={"string-1" <, "string-2", ...>}}, copyVars="ALL" | "ALL_NUMERIC" | {"variable-name-1" <, "variable-name-2", ...>}, currClus="string", display={caseSensitive=TRUE | FALSE, exclude=TRUE | FALSE, excludeAll=TRUE | FALSE, keyIsPath=TRUE | FALSE, names={"string-1" <, "string-2", ...>}, pathType="LABEL" | "NAME", traceNames=TRUE | FALSE}, loglik="string", maxpost="string", nextClus="string", outputTables={groupByVarsRaw=TRUE | FALSE, includeAll=TRUE | FALSE, names={"string-1" <, "string-2", ...>} | {key-1={casouttable-1} <, key-2={casouttable-2}, ...>}, repeated=TRUE | FALSE, replace=TRUE | FALSE}, pred="string", restore={caslib="string", dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2, ...>}, name="table-name", whereTable={casLib="string", dataSourceOptions={adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", vars={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression"}}, role="string", table={caslib="string", computedOnDemand=TRUE | FALSE, computedVars={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, computedVarsProgram="string", dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2, ...>}, groupBy={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, groupByMode="NOSORT" | "REDISTRIBUTE", importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", orderBy={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, singlePass=TRUE | FALSE, vars={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression", whereTable={casLib="string", dataSourceOptions={adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", vars={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression"}};
Einstellungen
ParameterBeschreibung
allstatsWenn auf True gesetzt, werden alle Statistiken zur Ausgabetabelle hinzugefügt.
casOutGibt die Einstellungen für eine Ausgabetabelle an.
copyVarsGibt eine Liste von einer oder mehreren Variablen an, die von der Eingabetabelle in die Ausgabetabelle kopiert werden sollen. Sie können alternativ den Wert ALL oder ALL_NUMERIC angeben, der jeweils alle Variablen oder alle numerischen Variablen aus der Eingabetabelle in die Ausgabetabelle kopiert.
currClusGibt ein Präfix für die Benennung der Schätzungen der Cluster-Mitgliedschaftswahrscheinlichkeit aus dem Erwartungsschritt (E-Schritt) an, der die Mittelwert- und Kovarianzschätzungen im abschließenden Maximierungsschritt (M-Schritt) erzeugt hat.
displayGibt eine Liste von Ergebnistabellen an, die zur Anzeige an den Client gesendet werden sollen.
loglikGibt ein Präfix für die Benennung der Cluster-Log-Likelihoods an.
maxpostGibt ein Präfix für die Benennung des Clusters mit der maximalen A-posteriori-Wahrscheinlichkeit an.
nextClusGibt ein Präfix für die Benennung der Schätzungen der Cluster-Mitgliedschaftswahrscheinlichkeit aus einem zusätzlichen Erwartungsschritt (E-Schritt) an, der die Mittelwert- und Kovarianzschätzungen aus dem abschließenden Maximierungsschritt (M-Schritt) verwendet.
outputTablesListet die Namen der Ergebnistabellen auf, die als CAS-Tabellen auf dem Server gespeichert werden sollen.
predGibt ein Präfix für die Benennung der vorhergesagten Werte an.
restoreGibt den zu verwendenden Item-Store für das Scoring an.
roleGibt den Namen für die Spalte an, die die Beobachtungsrolle enthält.
tableGibt die Eingabedatentabelle an.
Datenerstellung

Dieser Schritt erstellt eine Beispieltabelle `mycas.score_data` mit Beobachtungen, die bewertet werden sollen. Die Variablen `x1` und `x2` werden für das Scoring verwendet. Das Modell muss zuvor mit der Aktion `mbcFit` erstellt und in `mycas.my_model` gespeichert worden sein.

Kopiert!
1DATA mycas.score_data;
2INPUT x1 x2;
3DATALINES;
41.0 2.5
51.2 2.9
65.0 5.5
75.2 5.9
8;
9RUN;

Beispiele

Dieses Beispiel zeigt, wie die Aktion `mbcScore` verwendet wird, um eine neue Tabelle mit den Cluster-Gewichten zu erstellen, basierend auf einem zuvor gespeicherten Modell in `mycas.my_model`.

SAS® / CAS-Code Code wartet auf Validierung durch die Community
Kopiert!
1PROC CAS;
2mbc.mbcScore /
3 restore={name='my_model' caslib='mycas'},
4 TABLE={name='score_data' caslib='mycas'},
5 casOut={name='scored_output' caslib='mycas' replace=true};
6RUN;
7QUIT;
Ergebnis :
Die Aktion erzeugt eine Ausgabetabelle `mycas.scored_output`, die die ursprünglichen Daten sowie die Scoring-Ergebnisse enthält, wie z.B. Cluster-Zugehörigkeitswahrscheinlichkeiten.

Dieses Beispiel führt ein Scoring für die Tabelle `score_data` durch. Es werden alle verfügbaren Statistiken berechnet (`allstats=true`). Die Parameter `currClus`, `loglik` und `maxpost` werden verwendet, um die Namen der Ausgabespalten für die Clusterwahrscheinlichkeiten, die Log-Likelihood und den Cluster mit der höchsten A-posteriori-Wahrscheinlichkeit festzulegen. Die ursprünglichen Variablen werden ebenfalls in die Ausgabetabelle `scored_output_detailed` kopiert.

SAS® / CAS-Code Code wartet auf Validierung durch die Community
Kopiert!
1PROC CAS;
2mbc.mbcScore /
3 restore={name='my_model' caslib='mycas'},
4 TABLE={name='score_data' caslib='mycas'},
5 allstats=true,
6 copyVars={'x1', 'x2'},
7 currClus='prob_',
8 loglik='loglik_',
9 maxpost='max_post_cluster',
10 casOut={name='scored_output_detailed' caslib='mycas' replace=true};
11RUN;
12QUIT;
Ergebnis :
Erstellt die Tabelle `mycas.scored_output_detailed`, die `x1`, `x2`, die Cluster-Wahrscheinlichkeiten (mit dem Präfix 'prob_'), die Log-Likelihoods (mit dem Präfix 'loglik_') und die Spalte `max_post_cluster` mit der wahrscheinlichsten Cluster-Zuweisung enthält.

FAQ

Was ist der Hauptzweck der Aktion mbcScore?
Welcher Parameter ist erforderlich, um die zu bewertende Eingabedatentabelle anzugeben?
Wie gibt man das Modell an, das zum Bewerten verwendet werden soll?
Welchem Zweck dient der Parameter 'casOut'?
Wie kann ich alle Statistiken in die Ausgabetabelle aufnehmen?