mbcScore - WeAreCAS

Q: ¿Cuál es el propósito del parámetro 'restore'?

Especifica el almacén de elementos (item store) que se utilizará para la puntuación. Es un parámetro obligatorio.

Q: ¿Para qué sirve el parámetro 'casOut'?

Especifica la configuración para una tabla de salida. Es un parámetro obligatorio.

Q: ¿Qué hace el parámetro 'allstats'?

Cuando se establece en True, añade todas las estadísticas a la tabla de salida. El valor predeterminado es False.

Q: ¿Cómo se pueden copiar variables a la tabla de salida?

Se utiliza el parámetro 'copyVars', que especifica una lista de una o más variables para ser copiadas de la tabla de entrada a la de salida. También se puede especificar 'ALL' para todas las variables, o 'ALL_NUMERIC' para todas las variables numéricas.

Descripción

Produce ponderaciones de clustering utilizando un modelo previamente almacenado.

mbc.mbcScore <result=results> <status=rc> / allstats=TRUE | FALSE, casOut={caslib="string", compress=TRUE | FALSE, indexVars={"variable-name-1" <, "variable-name-2", ...>}, label="string", lifetime=64-bit-integer, maxMemSize=64-bit-integer, memoryFormat="DVR" | "INHERIT" | "STANDARD", name="table-name", promote=TRUE | FALSE, replace=TRUE | FALSE, replication=integer, tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE", threadBlockSize=64-bit-integer, timeStamp="string", where={"string-1" <, "string-2", ...>}}, copyVars="ALL" | "ALL_NUMERIC" | {"variable-name-1" <, "variable-name-2", ...>}, currClus="string", display={caseSensitive=TRUE | FALSE, exclude=TRUE | FALSE, excludeAll=TRUE | FALSE, keyIsPath=TRUE | FALSE, names={"string-1" <, "string-2", ...>}, pathType="LABEL" | "NAME", traceNames=TRUE | FALSE}, loglik="string", maxpost="string", nextClus="string", outputTables={groupByVarsRaw=TRUE | FALSE, includeAll=TRUE | FALSE, names={"string-1" <, "string-2", ...>} | {key-1={casouttable-1} <, key-2={casouttable-2}, ...>}, repeated=TRUE | FALSE, replace=TRUE | FALSE}, pred="string", restore={caslib="string", dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2, ...>}, name="table-name", whereTable={casLib="string", dataSourceOptions={adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", vars={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression"}}, role="string", table={caslib="string", computedOnDemand=TRUE | FALSE, computedVars={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, computedVarsProgram="string", dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2, ...>}, groupBy={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, groupByMode="NOSORT" | "REDISTRIBUTE", importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", orderBy={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, singlePass=TRUE | FALSE, vars={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression", whereTable={casLib="string", dataSourceOptions={adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", vars={{ format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression"}} ;

Parámetros

Parámetro	Descripción
allstats	Cuando se establece en True, agrega todas las estadísticas a la tabla de salida.
casOut	Especifica la configuración para una tabla de salida.
copyVars	Especifica una lista de una o más variables para ser copiadas de la tabla de entrada a la tabla de salida. Alternativamente, puede especificar el valor ALL, ALL_MODEL, o ALL_NUMERIC, que copia respectivamente todas las variables, todas las variables utilizadas en el modelado, o todas las variables numéricas de la tabla de entrada a la tabla de salida.
currClus	Especifica un prefijo para nombrar las estimaciones de probabilidad de pertenencia al clúster del paso de expectativa (E) que produjo las estimaciones de media y covarianza en el paso de maximización (M) final.
display	Especifica una lista de tablas de resultados para enviar al cliente para su visualización.
loglik	Especifica un prefijo para nombrar los logaritmos de verosimilitud del clúster.
maxpost	Especifica un prefijo para nombrar el clúster de máxima probabilidad posterior.
nextClus	Especifica un prefijo para nombrar las estimaciones de probabilidad de pertenencia al clúster de un paso de expectativa (E) adicional que utiliza las estimaciones de media y covarianza del paso de maximización (M) final.
outputTables	Lista los nombres de las tablas de resultados para guardarlas como tablas CAS en el servidor.
pred	Especifica un prefijo para nombrar los valores predichos.
restore	Especifica el almacén de elementos a utilizar en la puntuación.
role	Especifica el nombre de la columna que contiene el rol de la observación.
table	Especifica la tabla de datos de entrada.

Preparación de datos Ver hoja de preparación de datos

Creación de Datos de Ejemplo y Modelo

Primero, creamos un conjunto de datos de ejemplo y luego ejecutamos la acción mbcFit para generar un modelo que se guardará en un almacén de elementos. Este almacén se utilizará en los ejemplos de puntuación.

¡Copiado!

1	PROC CAS;
2	SESSION casauto;
3
4	/* Cargar datos a CAS */
5	load DATA=sashelp.iris out=iris_data caslib='casuser' replace;
6
7	/* Ajustar un modelo MBC y guardarlo */
8	mbc.mbcFit /
9	TABLE={name='iris_data' caslib='casuser'}
10	effects={'SepalLength', 'SepalWidth', 'PetalLength', 'PetalWidth'}
11	nClusters=3
12	store={name='mbc_store', caslib='casuser', replace=true};
13	RUN;
14	QUIT;

Ejemplos

Este ejemplo utiliza el almacén de elementos 'mbc_store' creado previamente para puntuar los datos de entrada 'iris_data' y guardar los resultados en 'iris_scored'.

Código SAS® / CAS Código en espera de validación por la comunidad

¡Copiado!

1
2	PROC CAS;
3	mbc.mbcScore / TABLE={name='iris_data', caslib='casuser'} restore={name='mbc_store', caslib='casuser'} casOut={name='iris_scored', caslib='casuser', replace=true} copyVars={'Species'};
4
5	RUN;
6
7	QUIT;
8

Resultado :
La tabla 'iris_scored' se crea en la caslib 'casuser'. Contendrá la variable 'Species' copiada de 'iris_data' y las nuevas variables de puntuación generadas por la acción mbcScore.

Este ejemplo muestra cómo puntuar los datos y personalizar los nombres de las variables de salida para la pertenencia al clúster, la probabilidad posterior máxima y el log-verosimilitud del clúster, además de solicitar todas las estadísticas disponibles.

Código SAS® / CAS Código en espera de validación por la comunidad

¡Copiado!

1
2	PROC CAS;
3	mbc.mbcScore / TABLE={name='iris_data', caslib='casuser'} restore={name='mbc_store', caslib='casuser'} casOut={name='iris_scored_detailed', caslib='casuser', replace=true} copyVars={'ALL'} maxpost='Cluster_Asignado' pred='Prob_Pertenencia' loglik='LogVerosimilitud' allstats=true;
4
5	RUN;
6
7	QUIT;
8

Resultado :
Se crea una nueva tabla 'iris_scored_detailed' que incluye todas las variables originales más las columnas personalizadas 'Cluster_Asignado', 'Prob_Pertenencia_1', 'Prob_Pertenencia_2', 'Prob_Pertenencia_3', y columnas de 'LogVerosimilitud' para cada clúster, junto con cualquier otra estadística disponible.

FAQ

¿Qué es la acción mbcScore?

¿Cuál es el propósito del parámetro 'restore'?

¿Para qué sirve el parámetro 'casOut'?

¿Qué hace el parámetro 'allstats'?

¿Cómo se pueden copiar variables a la tabla de salida?

¿Qué especifica el parámetro 'currClus'?

¿Qué representa el prefijo en el parámetro 'nextClus'?

Actions associées

mbc

mbcFit

Realiza clustering basado en modelos utilizando el algoritmo EM (Expectation-...

Tabla de contenidos

Descripción

Creación de Datos de Ejemplo y Modelo

Ejemplos

Ejemplo Básico de Puntuación

Ejemplo Detallado con Nombres de Salida Personalizados y Estadísticas Completas

FAQ

Actions associées

mbcFit