Publié le :
Statistique CREATION_INTERNE

Exemple de documentation 5 pour PROC HPSPLIT

Ce code est également disponible en : Deutsch English Español
En attente de validation
Ce script illustre l'utilisation de la procédure HPSPLIT, une procédure de statistiques haute performance. Il commence par créer un jeu de données nommé 'MBE_Data' contenant des informations sur des expériences. Ensuite, il applique un modèle d'arbre de classification pour prédire la variable 'Usable' en fonction des autres variables. La profondeur maximale de l'arbre est fixée à 6 et aucune élagage (pruning) n'est appliqué, ce qui signifie que l'arbre sera entièrement développé jusqu'à cette profondeur.
Analyse des données

Type : CREATION_INTERNE


Les données sont créées directement dans le script via une étape DATA et l'instruction 'datalines'. Elles ne proviennent ni de SASHELP ni d'un fichier externe.

1 Bloc de code
DATA STEP Data
Explication :
Ce bloc est une étape DATA qui crée la table 'MBE_Data'. Il définit cinq variables avec leurs labels, puis lit 20 observations directement depuis le code à l'aide de l'instruction 'datalines'. Les données sont stockées dans la librairie WORK par défaut.
Copié !
1DATA MBE_Data;
2 label gTemp = 'Growth Temperature of Substrate';
3 label aTemp = 'Anneal Temperature';
4 label Rot = 'Rotation Speed';
5 label Dopant = 'Dopant Atom';
6 label Usable = 'Experiment Could Be Performed';
7 
8 INPUT gTemp aTemp Rot Dopant $ 39-40 Usable $ 47-54;
9 DATALINES;
10 384.614 633.172 1.01933 C Unusable
11 363.874 512.942 0.72057 C Unusable
12 397.395 671.179 0.90419 C Unusable
13 389.962 653.940 1.01417 C Unusable
14 387.763 612.545 1.00417 C Unusable
15 394.206 617.021 1.07188 Si Usable
16 387.135 616.035 0.94740 Si Usable
17 428.783 745.345 0.99087 Si Unusable
18 399.365 600.932 1.23307 Si Unusable
19 455.502 648.821 1.01703 Si Unusable
20 387.362 697.589 1.01623 Ge Usable
21 408.872 640.406 0.94543 Ge Usable
22 407.734 628.196 1.05137 Ge Usable
23 417.343 612.328 1.03960 Ge Usable
24 482.539 669.392 0.84249 Ge Unusable
25 367.116 564.246 0.99642 Sn Unusable
26 398.594 733.839 1.08744 Sn Unusable
27 378.032 619.561 1.06137 Sn Usable
28 357.544 606.871 0.85205 Sn Unusable
29 384.578 635.858 1.12215 Sn Unusable
30 ;
31RUN;
2 Bloc de code
PROC HPSPLIT
Explication :
Ce bloc exécute la procédure HPSPLIT pour construire un arbre de classification. L'option 'data=MBE_Data' spécifie la table d'entrée. 'maxdepth=6' limite la profondeur de l'arbre à 6 niveaux. L'instruction 'class' déclare 'Usable' et 'Dopant' comme des variables catégorielles. 'model' définit 'Usable' comme la variable cible à prédire par les autres variables. 'prune none' instruit la procédure de ne pas élaguer l'arbre, conservant sa structure complète jusqu'à la profondeur maximale spécifiée.
Copié !
1PROC HPSPLIT DATA=MBE_Data maxdepth=6;
2 class Usable Dopant;
3 model Usable = gTemp aTemp Rot Dopant;
4 prune none;
5RUN;
Ce matériel est fourni "tel quel" par We Are Cas. Il n'y a aucune garantie, expresse ou implicite, quant à la qualité marchande ou à l'adéquation à un usage particulier concernant le matériel ou le code contenu dans les présentes. We Are Cas n'est pas responsable des erreurs dans ce matériel tel qu'il existe maintenant ou existera, et We Are Cas ne fournit pas de support technique pour celui-ci.
Informations de Copyright : S A S S A M P L E L I B R A R Y