entityRes

match

Description

L'action `entityRes.match` est utilisée pour le rapprochement de données dans la gestion des entités. Elle identifie et regroupe les enregistrements similaires dans une table en clusters, en se basant sur des règles de correspondance définies par l'utilisateur. Cette action est fondamentale pour la résolution d'entités, permettant de consolider des données provenant de sources hétérogènes et de créer une vue unique et fiable des entités.

entityRes.match { algorithm="AUTO" | "DISTRIBUTED" | "SINGLE", clusterId="string", clusterIdLabel="string", clusterIdType="CHAR" | "DOUBLE" | "INT", columns={"variable-name-1" <, "variable-name-2", ...>}, doNotCluster="string", emptyStringIsNull=TRUE | FALSE, inTable={table-specification}, matchRules={{rule-1} <, {rule-2}, ...>}, nThreads=integer, nullValuesMatch=TRUE | FALSE, outTable={table-specification} }
Paramètres
ParamètreDescription
algorithmSpécifie l'algorithme à utiliser. AUTO, DISTRIBUTED, ou SINGLE.
clusterIdSpécifie le nom de la colonne dans la table de sortie contenant les identifiants de cluster.
clusterIdLabelSpécifie l'étiquette de la colonne dans la table de sortie contenant les identifiants de cluster.
clusterIdTypeSpécifie le type de la colonne dans la table de sortie contenant les identifiants de cluster (CHAR, DOUBLE, INT).
columnsSpécifie les noms des colonnes de la table d'entrée à transmettre à la table de sortie. Si non spécifié, toutes les colonnes d'entrée apparaîtront en sortie.
doNotClusterSpécifie le nom de la colonne dans la table d'entrée contenant le drapeau booléen 'Ne Pas Clusteriser'. Si la valeur est 'true' ou '1', la ligne sera placée dans son propre cluster.
emptyStringIsNullSpécifie si les valeurs de chaîne vides doivent être traitées comme des valeurs NULL.
inTableSpécifie la table de données d'entrée.
matchRulesSpécifie les noms des colonnes à utiliser pour faire correspondre les lignes et les regrouper en clusters.
nThreadsSpécifie le nombre de threads à utiliser (0 pour utiliser la valeur par défaut du système sur chaque worker).
nullValuesMatchSpécifie si les valeurs NULL doivent être regroupées.
outTableSpécifie la table de données de sortie où les colonnes transmises et les identifiants de cluster doivent être écrits.

Exemples

FAQ

Quelle est l'utilité de l'action `match` dans SAS Viya ?
Quels sont les paramètres obligatoires pour utiliser l'action `match` ?
À quoi sert le paramètre `clusterId` et quelle est sa valeur par défaut ?
Comment fonctionnent les règles de rapprochement (`matchRules`) ?
Comment l'action `match` gère-t-elle les valeurs NULL ou les chaînes de caractères vides ?
Quels algorithmes peuvent être utilisés avec le paramètre `algorithm` ?