mbc

mbcScore

Descripción

Produce ponderaciones de clustering utilizando un modelo previamente almacenado.

mbc.mbcScore <result=results> <status=rc> / allstats=TRUE | FALSE, casOut={caslib="string", compress=TRUE | FALSE, indexVars={"variable-name-1" <, "variable-name-2", ...>}, label="string", lifetime=64-bit-integer, maxMemSize=64-bit-integer, memoryFormat="DVR" | "INHERIT" | "STANDARD", name="table-name", promote=TRUE | FALSE, replace=TRUE | FALSE, replication=integer, tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE", threadBlockSize=64-bit-integer, timeStamp="string", where={"string-1" <, "string-2", ...>}}, copyVars="ALL" | "ALL_NUMERIC" | {"variable-name-1" <, "variable-name-2", ...>}, currClus="string", display={caseSensitive=TRUE | FALSE, exclude=TRUE | FALSE, excludeAll=TRUE | FALSE, keyIsPath=TRUE | FALSE, names={"string-1" <, "string-2", ...>}, pathType="LABEL" | "NAME", traceNames=TRUE | FALSE}, loglik="string", maxpost="string", nextClus="string", outputTables={groupByVarsRaw=TRUE | FALSE, includeAll=TRUE | FALSE, names={"string-1" <, "string-2", ...>} | {key-1={casouttable-1} <, key-2={casouttable-2}, ...>}, repeated=TRUE | FALSE, replace=TRUE | FALSE}, pred="string", restore={caslib="string", dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2, ...>}, name="table-name", whereTable={casLib="string", dataSourceOptions={adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", vars={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression"}}, role="string", table={caslib="string", computedOnDemand=TRUE | FALSE, computedVars={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, computedVarsProgram="string", dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2, ...>}, groupBy={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, groupByMode="NOSORT" | "REDISTRIBUTE", importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", orderBy={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, singlePass=TRUE | FALSE, vars={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression", whereTable={casLib="string", dataSourceOptions={adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", vars={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression"}} ;
Parámetros
ParámetroDescripción
allstatsCuando se establece en True, agrega todas las estadísticas a la tabla de salida.
casOutEspecifica la configuración para una tabla de salida.
copyVarsEspecifica una lista de una o más variables para ser copiadas de la tabla de entrada a la tabla de salida. Alternativamente, puede especificar el valor ALL, ALL_MODEL, o ALL_NUMERIC, que copia respectivamente todas las variables, todas las variables utilizadas en el modelado, o todas las variables numéricas de la tabla de entrada a la tabla de salida.
currClusEspecifica un prefijo para nombrar las estimaciones de probabilidad de pertenencia al clúster del paso de expectativa (E) que produjo las estimaciones de media y covarianza en el paso de maximización (M) final.
displayEspecifica una lista de tablas de resultados para enviar al cliente para su visualización.
loglikEspecifica un prefijo para nombrar los logaritmos de verosimilitud del clúster.
maxpostEspecifica un prefijo para nombrar el clúster de máxima probabilidad posterior.
nextClusEspecifica un prefijo para nombrar las estimaciones de probabilidad de pertenencia al clúster de un paso de expectativa (E) adicional que utiliza las estimaciones de media y covarianza del paso de maximización (M) final.
outputTablesLista los nombres de las tablas de resultados para guardarlas como tablas CAS en el servidor.
predEspecifica un prefijo para nombrar los valores predichos.
restoreEspecifica el almacén de elementos a utilizar en la puntuación.
roleEspecifica el nombre de la columna que contiene el rol de la observación.
tableEspecifica la tabla de datos de entrada.
Creación de Datos de Ejemplo y Modelo

Primero, creamos un conjunto de datos de ejemplo y luego ejecutamos la acción mbcFit para generar un modelo que se guardará en un almacén de elementos. Este almacén se utilizará en los ejemplos de puntuación.

¡Copiado!
1PROC CAS;
2SESSION casauto;
3 
4/* Cargar datos a CAS */
5load DATA=sashelp.iris out=iris_data caslib='casuser' replace;
6 
7/* Ajustar un modelo MBC y guardarlo */
8mbc.mbcFit /
9 TABLE={name='iris_data' caslib='casuser'}
10 effects={'SepalLength', 'SepalWidth', 'PetalLength', 'PetalWidth'}
11 nClusters=3
12 store={name='mbc_store', caslib='casuser', replace=true};
13RUN;
14QUIT;

Ejemplos

Este ejemplo utiliza el almacén de elementos 'mbc_store' creado previamente para puntuar los datos de entrada 'iris_data' y guardar los resultados en 'iris_scored'.

Código SAS® / CAS Código en espera de validación por la comunidad
¡Copiado!
1 
2PROC CAS;
3mbc.mbcScore / TABLE={name='iris_data', caslib='casuser'} restore={name='mbc_store', caslib='casuser'} casOut={name='iris_scored', caslib='casuser', replace=true} copyVars={'Species'};
4 
5RUN;
6 
7QUIT;
8 
Resultado :
La tabla 'iris_scored' se crea en la caslib 'casuser'. Contendrá la variable 'Species' copiada de 'iris_data' y las nuevas variables de puntuación generadas por la acción mbcScore.

Este ejemplo muestra cómo puntuar los datos y personalizar los nombres de las variables de salida para la pertenencia al clúster, la probabilidad posterior máxima y el log-verosimilitud del clúster, además de solicitar todas las estadísticas disponibles.

Código SAS® / CAS Código en espera de validación por la comunidad
¡Copiado!
1 
2PROC CAS;
3mbc.mbcScore / TABLE={name='iris_data', caslib='casuser'} restore={name='mbc_store', caslib='casuser'} casOut={name='iris_scored_detailed', caslib='casuser', replace=true} copyVars={'ALL'} maxpost='Cluster_Asignado' pred='Prob_Pertenencia' loglik='LogVerosimilitud' allstats=true;
4 
5RUN;
6 
7QUIT;
8 
Resultado :
Se crea una nueva tabla 'iris_scored_detailed' que incluye todas las variables originales más las columnas personalizadas 'Cluster_Asignado', 'Prob_Pertenencia_1', 'Prob_Pertenencia_2', 'Prob_Pertenencia_3', y columnas de 'LogVerosimilitud' para cada clúster, junto con cualquier otra estadística disponible.

FAQ

¿Qué es la acción mbcScore?
¿Cuál es el propósito del parámetro 'restore'?
¿Para qué sirve el parámetro 'casOut'?
¿Qué hace el parámetro 'allstats'?
¿Cómo se pueden copiar variables a la tabla de salida?
¿Qué especifica el parámetro 'currClus'?
¿Qué representa el prefijo en el parámetro 'nextClus'?