Quelle est la fonction du paramètre 'tokenizer' et quelles sont ses valeurs possibles ?
4 vues
Réponse
Le paramètre 'tokenizer' définit le type de tokeniseur à utiliser. La valeur par défaut est 'STANDARD', qui utilise un tokeniseur spécifique à la langue. L'autre option est 'BASIC', qui sépare le texte en fonction des espaces, de la ponctuation et des caractères spécifiques aux langues chinoise, japonaise, coréenne et thaï. L'option 'BASIC' n'est disponible que pour ces langues et peut améliorer la correspondance des règles pour des textes spécifiques.
SAS and all other SAS Institute Inc. product or service names are registered trademarks or trademarks of SAS Institute Inc. in the USA and other countries. ® indicates USA registration. WeAreCAS is an independent community site and is not affiliated with SAS Institute Inc.
This site uses technical and analytical cookies to improve your experience.
Read more.