entityRes

match

Description

L'action `entityRes.match` est utilisée pour le rapprochement de données dans la gestion des entités. Elle identifie et regroupe les enregistrements similaires dans une table en clusters, en se basant sur des règles de correspondance définies par l'utilisateur. Cette action est fondamentale pour la résolution d'entités, permettant de consolider des données provenant de sources hétérogènes et de créer une vue unique et fiable des entités.

entityRes.match { algorithm="AUTO" | "DISTRIBUTED" | "SINGLE", clusterId="string", clusterIdLabel="string", clusterIdType="CHAR" | "DOUBLE" | "INT", columns={"variable-name-1" <, "variable-name-2", ...>}, doNotCluster="string", emptyStringIsNull=TRUE | FALSE, inTable={table-specification}, matchRules={{rule-1} <, {rule-2}, ...>}, nThreads=integer, nullValuesMatch=TRUE | FALSE, outTable={table-specification} }
Paramètres
ParamètreDescription
algorithm Spécifie l'algorithme à utiliser. AUTO, DISTRIBUTED, ou SINGLE.
clusterId Spécifie le nom de la colonne dans la table de sortie contenant les identifiants de cluster.
clusterIdLabel Spécifie l'étiquette de la colonne dans la table de sortie contenant les identifiants de cluster.
clusterIdType Spécifie le type de la colonne dans la table de sortie contenant les identifiants de cluster (CHAR, DOUBLE, INT).
columns Spécifie les noms des colonnes de la table d'entrée à transmettre à la table de sortie. Si non spécifié, toutes les colonnes d'entrée apparaîtront en sortie.
doNotCluster Spécifie le nom de la colonne dans la table d'entrée contenant le drapeau booléen 'Ne Pas Clusteriser'. Si la valeur est 'true' ou '1', la ligne sera placée dans son propre cluster.
emptyStringIsNull Spécifie si les valeurs de chaîne vides doivent être traitées comme des valeurs NULL.
inTable Spécifie la table de données d'entrée.
matchRules Spécifie les noms des colonnes à utiliser pour faire correspondre les lignes et les regrouper en clusters.
nThreads Spécifie le nombre de threads à utiliser (0 pour utiliser la valeur par défaut du système sur chaque worker).
nullValuesMatch Spécifie si les valeurs NULL doivent être regroupées.
outTable Spécifie la table de données de sortie où les colonnes transmises et les identifiants de cluster doivent être écrits.

Exemples

FAQ

Quelle est l'utilité de l'action `match` dans SAS Viya ?
Quels sont les paramètres obligatoires pour utiliser l'action `match` ?
À quoi sert le paramètre `clusterId` et quelle est sa valeur par défaut ?
Comment fonctionnent les règles de rapprochement (`matchRules`) ?
Comment l'action `match` gère-t-elle les valeurs NULL ou les chaînes de caractères vides ?
Quels algorithmes peuvent être utilisés avec le paramètre `algorithm` ?