Publié le :
ETL CREATION_INTERNE

Exemples : Trier et Afficher les Informations Descriptives pour les Jeux de Données

Ce code est également disponible en : Deutsch English Español
En attente de validation
L'analyse fonctionnelle détaille trois scénarios principaux : le tri d'un jeu de données en utilisant l'option SORTEDBY= dans une étape DATA, l'affichage des informations descriptives d'un jeu de données avec PROC CONTENTS, et la visualisation des informations de tri d'un jeu de données. Chaque section présente le code SAS© correspondant, son exécution et les sorties ou concepts clés associés. Une attention particulière est portée à la distinction entre un tri 'validé' (effectué par PROC SORT ou PROC SQL) et un tri 'non validé' (défini via l'option SORTEDBY= dans une étape DATA).
Analyse des données

Type : CREATION_INTERNE


Les exemples utilisent des données générées en interne via la déclaration DATALINES et des jeux de données de la bibliothèque SASHELP (SASHELP.SNACKS et SASHELP.AIR) pour démontrer les concepts sans dépendre de sources de données externes.

1 Bloc de code
DATA STEP / PROC CONTENTS Data
Explication :
Cet exemple utilise l'option de jeu de données SORTEDBY= pour indiquer que le jeu de données 'sorttest' est trié par 'priority' (ordre croissant) puis par 'indate' (ordre décroissant). La procédure CONTENTS est ensuite utilisée pour afficher les informations descriptives du jeu de données, y compris l'indicateur de tri.
Copié !
1DATA sorttest (sortedby=priority descending indate);
2 INPUT priority indate date7. office $ code $;
3 FORMAT indate date7.;
4 DATALINES;
51 03may01 CH J8U
61 21mar01 LA M91
71 01dec00 FW L6R
81 27feb99 FW Q2A
92 15jan00 FW I9U
102 09jul99 CH P3Q
113 08apr99 CH H5T
123 31jan99 FW D2W
13;
14PROC CONTENTS DATA=sorttest; RUN;
2 Bloc de code
PROC CONTENTS
Explication :
Cet exemple simple utilise la procédure CONTENTS pour afficher les informations descriptives du jeu de données SASHELP.SNACKS. Cela inclut les métadonnées telles que le nombre d'observations, la date de dernière modification, les attributs des variables (nom, type, longueur, format, label) et si le jeu de données est trié.
Copié !
1PROC CONTENTS DATA=sashelp.snacks;
2RUN;
3 Bloc de code
PROC CONTENTS / DATA STEP / PROC SORT Data
Explication :
Cet exemple en trois parties montre comment les informations de tri sont reflétées dans les métadonnées d'un jeu de données. D'abord, il affiche les informations de 'Sashelp.Air' non trié. Ensuite, il crée une copie du jeu de données 'air' en utilisant l'option SORTEDBY= dans l'instruction DATA, montrant que l'indicateur de tri est présent mais non validé. Enfin, il utilise PROC SORT pour trier le jeu de données 'air' par la variable 'air' en ordre décroissant, résultant en un tri 'validé' tel qu'indiqué par la procédure CONTENTS.
Copié !
1PROC CONTENTS DATA=sashelp.air; RUN;
2 
3DATA air(sortedby=air);
4 SET sashelp.air;
5RUN;
6 
7PROC CONTENTS DATA=air; RUN;
8 
9PROC SORT DATA=air; BY descending air; RUN;
10PROC CONTENTS DATA=air; RUN;
Ce matériel est fourni "tel quel" par We Are Cas. Il n'y a aucune garantie, expresse ou implicite, quant à la qualité marchande ou à l'adéquation à un usage particulier concernant le matériel ou le code contenu dans les présentes. We Are Cas n'est pas responsable des erreurs dans ce matériel tel qu'il existe maintenant ou existera, et We Are Cas ne fournit pas de support technique pour celui-ci.
Informations de Copyright : Copyright © SAS Institute Inc. All Rights Reserved


Banner
Le Conseil de l'Expert
Expert
Stéphanie
Spécialiste Machine Learning et IA.
« N'utilisez SORTEDBY= que dans des flux très spécifiques où la performance est critique et où la source de données (comme une base SQL externe via un ORDER BY) garantit déjà l'ordre. Pour tout le reste, privilégiez une PROC SORT : le temps CPU consommé par le tri est une assurance contre les données corrompues et les erreurs de logique BY »