L'action `entityRes.match` est utilisée pour le rapprochement de données dans la gestion des entités. Elle identifie et regroupe les enregistrements similaires dans une table en clusters, en se basant sur des règles de correspondance définies par l'utilisateur. Cette action est fondamentale pour la résolution d'entités, permettant de consolider des données provenant de sources hétérogènes et de créer une vue unique et fiable des entités.
| Paramètre | Description |
|---|---|
| algorithm | Spécifie l'algorithme à utiliser. AUTO, DISTRIBUTED, ou SINGLE. |
| clusterId | Spécifie le nom de la colonne dans la table de sortie contenant les identifiants de cluster. |
| clusterIdLabel | Spécifie l'étiquette de la colonne dans la table de sortie contenant les identifiants de cluster. |
| clusterIdType | Spécifie le type de la colonne dans la table de sortie contenant les identifiants de cluster (CHAR, DOUBLE, INT). |
| columns | Spécifie les noms des colonnes de la table d'entrée à transmettre à la table de sortie. Si non spécifié, toutes les colonnes d'entrée apparaîtront en sortie. |
| doNotCluster | Spécifie le nom de la colonne dans la table d'entrée contenant le drapeau booléen 'Ne Pas Clusteriser'. Si la valeur est 'true' ou '1', la ligne sera placée dans son propre cluster. |
| emptyStringIsNull | Spécifie si les valeurs de chaîne vides doivent être traitées comme des valeurs NULL. |
| inTable | Spécifie la table de données d'entrée. |
| matchRules | Spécifie les noms des colonnes à utiliser pour faire correspondre les lignes et les regrouper en clusters. |
| nThreads | Spécifie le nombre de threads à utiliser (0 pour utiliser la valeur par défaut du système sur chaque worker). |
| nullValuesMatch | Spécifie si les valeurs NULL doivent être regroupées. |
| outTable | Spécifie la table de données de sortie où les colonnes transmises et les identifiants de cluster doivent être écrits. |