Publicado el :
Calidad de Datos CREATION_INTERNE

Uso Básico de PROC DATAMETRICS

Este código también está disponible en: Deutsch English Français
En espera de validación
El procedimiento DATAMETRICS permite un perfilado rápido y eficiente de los datos. Al especificar simplemente una tabla de entrada y una tabla de salida, genera automáticamente métricas para todas las variables presentes. Esto incluye la detección de identidades potenciales, valores faltantes, formatos de datos y otros indicadores esenciales para evaluar la calidad de los datos. La ausencia de la instrucción 'IDENTITIES' significa que no se realiza ningún análisis de identificación específico, y se utilizan las opciones predeterminadas para todos los cálculos.
Análisis de datos

Type : CREATION_INTERNE


Los ejemplos utilizan datos generados (datalines) para asegurar la autonomía y la reproducibilidad.

1 Bloque de código
PROC DATAMETRICS Data
Explicación :
Este ejemplo muestra el uso más simple de PROC DATAMETRICS. Se crea una tabla de entrada 'my_data' con datos en línea. El procedimiento se ejecuta luego especificando solo la tabla de entrada y una tabla de salida ('my_results'). Por defecto, genera métricas de calidad para todas las variables de 'my_data'. La instrucción 'proc print' muestra los resultados para su examen.
¡Copiado!
1DATA my_data;
2 INPUT ID $ Name $ Age Score;
3 DATALINES;
4 001 John 30 95
5 002 Jane 24 88
6 003 Mike . 72
7 004 Jane 24 88
8 005 Chris 45 60
9 006 John 30 95
10 007 Sarah 29 .
11 ;
12RUN;
13 
14PROC DATAMETRICS DATA=my_data out=my_results;
15RUN;
16 
17PROC PRINT DATA=my_results;
18 title 'Resultados Básicos de PROC DATAMETRICS';
19RUN;
2 Bloque de código
PROC DATAMETRICS Data
¡Copiado!
1DATA employees;
2 INPUT EmployeeID Name $ Department $ Salary DateOfHire:yymmdd10.;
3 FORMAT DateOfHire yymmdd10.;
4 DATALINES;
5 101 Alice Sales 60000 2020-01-15
6 102 Bob Marketing 75000 2019-03-22
7 103 Alice Sales 60000 2020-01-15
8 104 Charlie IT 80000 2021-07-01
9 105 David Sales 62000 2020-01-15
10 ;
11RUN;
12 
13PROC DATAMETRICS DATA=employees out=employee_metrics;
14 variables EmployeeID Name Department Salary;
15 OUTPUT metric=ALL;
16RUN;
17 
18PROC PRINT DATA=employee_metrics;
19 title 'Métricas de Calidad para Variables Específicas';
20RUN;
3 Bloque de código
PROC DATAMETRICS Data
¡Copiado!
1DATA transactions;
2 INPUT TransactionID CustomerID ProductID $ Quantity Price Date:yymmdd10.;
3 FORMAT Date yymmdd10.;
4 DATALINES;
5 T001 C001 P001 2 15.50 2023-01-05
6 T002 C002 P002 1 10.00 2023-01-05
7 T003 C001 P001 2 15.50 2023-01-05
8 T004 C003 P003 3 25.75 2023-01-06
9 T005 C001 P001 2 15.50 2023-01-05
10 ;
11RUN;
12 
13PROC DATAMETRICS DATA=transactions out=transaction_summary;
14 identities TransactionID CustomerID ProductID;
15 variables Quantity Price;
16 OUTPUT metric=ALL outall;
17RUN;
18 
19PROC PRINT DATA=transaction_summary;
20 title 'Análisis Avanzado de Métricas e Identidades de Transacciones';
21RUN;
4 Bloque de código
PROC DATAMETRICS (CAS) Data
¡Copiado!
1/* Connexion à la session CAS et chargement des données */
2cas;
3LIBNAME mycas cas;
4 
5DATA mycas.sales_data;
6 INPUT SaleID $ Region $ Amount Date:yymmdd10.;
7 FORMAT Date yymmdd10.;
8 DATALINES;
9 S001 East 1200.50 2024-01-10
10 S002 West 850.25 2024-01-11
11 S003 North 1500.00 2024-01-10
12 S004 South 980.75 2024-01-12
13 S005 East . 1000.00 2024-01-13
14 ;
15RUN;
16 
17/* Exécution de PROC DATAMETRICS sur CAS */
18PROC DATAMETRICS DATA=mycas.sales_data out=mycas.sales_metrics;
19 variables SaleID Region Amount Date;
20 OUTPUT metric=ALL;
21RUN;
22 
23/* Affichage des résultats depuis CAS */
24PROC PRINT DATA=mycas.sales_metrics;
25 title 'Métricas de Calidad de los Datos de Ventas (CAS)';
26RUN;
27 
28/* Arrêt de la session CAS */
29cas term;
Este material se proporciona "tal cual" por We Are Cas. No hay garantías, expresas o implícitas, en cuanto a la comerciabilidad o idoneidad para un propósito particular con respecto a los materiales o el código contenidos en este documento. We Are Cas no es responsable de los errores en este material tal como existe ahora o existirá, ni We Are Cas proporciona soporte técnico para el mismo.