Scénario de test & Cas d'usage
Puntuación de documentos de texto basada en reglas.
Descubrir todas las acciones de textRuleScoreCrea una tabla de entrada con reseñas de hoteles. Incluye identificador de reseña y el texto del comentario.
| 1 | DATA mycas.hotel_reviews; |
| 2 | INFILE DATALINES delimiter='|'; |
| 3 | LENGTH review_id $10 text_content $500; |
| 4 | INPUT review_id $ text_content $; |
| 5 | DATALINES; |
| 6 | REV001|La piscina estaba impecable y el desayuno buffet era delicioso. Una estancia perfecta. |
| 7 | REV002|El wifi era terriblemente lento, imposible trabajar. Además, la habitación olía a humedad. |
| 8 | REV003|Desayuno correcto, pero la piscina necesita una renovación urgente. El personal, muy amable. |
| 9 | REV004|Me encantó todo, especialmente el rápido acceso a internet y la calidad de la comida. |
| 10 | REV005|El servicio es bueno, pero no hay wifi gratis en las habitaciones, lo cual es decepcionante en 2025. |
| 11 | ; |
| 12 | RUN; |
| 1 | PROC CAS; |
| 2 | textRuleDevelop.compileConcept |
| 3 | config=' |
| 4 | CONCEPT: SERVICIO (RULE:(OR, "piscina", "wifi", "internet", "desayuno", "comida")) |
| 5 | CONCEPT: SENTIMIENTO_POS (RULE:(OR, "impecable", "delicioso", "perfecta", "amable", "encantó", "rápido")) |
| 6 | CONCEPT: SENTIMIENTO_NEG (RULE:(OR, "lento", "imposible", "humedad", "urgente", "decepcionante")) |
| 7 | ' |
| 8 | casOut={caslib="casuser", name="hotel_liti_model", replace=true}; |
| 9 | RUN; |
| 1 | PROC CAS; |
| 2 | textRuleScore.applyConcept |
| 3 | docId="review_id" |
| 4 | text="text_content" |
| 5 | TABLE={caslib="casuser", name="hotel_reviews"} |
| 6 | model={caslib="casuser", name="hotel_liti_model"} |
| 7 | casOut={caslib="casuser", name="hotel_concepts_out", replace=true} |
| 8 | factOut={caslib="casuser", name="hotel_facts_out", replace=true}; |
| 9 | RUN; |
Se espera que la tabla 'hotel_concepts_out' contenga las coincidencias para los conceptos 'SERVICIO', 'SENTIMIENTO_POS' y 'SENTIMIENTO_NEG'. Por ejemplo, para REV001, se deben identificar 'piscina' y 'desayuno' como 'SERVICIO', y 'impecable' y 'delicioso' como 'SENTIMIENTO_POS'. La tabla 'hotel_facts_out' estará vacía al no haberse definido reglas de hechos.