Construit un modèle de concept en utilisant la configuration de concept et les entités prédéfinies.
| Paramètre | Description |
|---|---|
| casOut | Spécifie la table CAS de sortie qui contient le binaire du modèle de concept. Cette table peut être utilisée par les actions tpParse et tmMine. |
| config | Spécifie le nom de la variable de la table CAS qui contient les informations de configuration pour compiler le modèle de concept. |
| enablePredefined | Spécifie si les entités prédéfinies doivent être incluses lors de la compilation du modèle de concept. |
| language | Spécifie la langue utilisée pour définir les binaires linguistiques. |
| predefinedSentiment | Si vrai, le modèle de sentiment prédéfini pour la langue spécifiée avec le paramètre language= sera étendu. |
| ruleId | Spécifie le nom de la variable de la table CAS qui contient les identifiants des règles. |
| table | Spécifie une table CAS d'entrée qui contient les informations de configuration du concept. |
| tokenizer | Spécifie quel tokenizer utiliser dans le modèle de concept. 'STANDARD' (défaut) utilise un tokenizer spécifique à la langue. 'BASIC' sépare les mots par des espaces, des signes de ponctuation et des caractères CJK ; il n'est disponible que pour le chinois, le japonais ou le coréen. |
Ce bloc de données crée une table SAS nommée 'concepts_in' contenant les règles pour un modèle de concept. Chaque ligne définit une règle avec un ID et sa définition de configuration LITI.
| 1 | DATA concepts_in; |
| 2 | LENGTH rule_id $ 20 config $ 500; |
| 3 | INFILE DATALINES dsd dlm='|'; |
| 4 | INPUT rule_id $ config; |
| 5 | DATALINES; |
| 6 | concept1|CONCEPT:concept1 |
| 7 | concept2|CONCEPT:concept2:test |
| 8 | ; |
| 9 | RUN; |
Cet exemple montre comment compiler un ensemble de règles de concept à partir d'une table d'entrée pour créer un modèle de concept binaire dans une table de sortie.
| 1 | PROC CAS; |
| 2 | load DATA=sashelp.concepts_in casout='concepts_in' replace; |
| 3 | textRuleDevelop.compileConcept / |
| 4 | TABLE={name='concepts_in'}, |
| 5 | casOut={name='concept_model', replace=true}, |
| 6 | ruleId='rule_id', |
| 7 | config='config'; |
| 8 | RUN; |
Cet exemple illustre l'utilisation du tokenizer 'BASIC' pour la compilation de concepts, ce qui est utile pour les langues comme le chinois, le japonais ou le coréen afin d'améliorer la correspondance des règles en segmentant le texte différemment du tokenizer standard.
| 1 | PROC CAS; |
| 2 | load DATA=sashelp.concepts_in casout='concepts_in' replace; |
| 3 | textRuleDevelop.compileConcept / |
| 4 | TABLE={name='concepts_in'}, |
| 5 | casOut={name='concept_model_basic', replace=true}, |
| 6 | ruleId='rule_id', |
| 7 | config='config', |
| 8 | language='JAPANESE', |
| 9 | tokenizer='BASIC'; |
| 10 | RUN; |
Un hôpital universitaire souhaite analyser des comptes-rendus cliniques non structurés pour identifier automatiquement les effets secondaires de médicaments (concepts personnali...
Une plateforme e-commerce veut aller au-delà du sentiment global positif/négatif. Elle souhaite compiler un modèle complexe capable de détecter des sentiments spécifiques liés à...
Le support technique d'une multinationale reçoit des tickets en Japonais. Les règles standards de découpage des mots (basées sur les espaces) ne fonctionnent pas. Le test vise à...