Veröffentlicht am :
Statistik CREATION_INTERNE

Dokumentationsbeispiel 5 für PROC HPSPLIT

Dieser Code ist auch verfügbar auf: English Español Français
Wartet auf Validierung
Dieses Skript veranschaulicht die Verwendung der HPSPLIT-Prozedur, einer Hochleistungsstatistikprozedur. Es beginnt mit der Erstellung eines Datensatzes namens 'MBE_Data', der Informationen über Experimente enthält. Anschließend wendet es ein Klassifikationsbaummodell an, um die Variable 'Usable' basierend auf den anderen Variablen vorherzusagen. Die maximale Tiefe des Baumes wird auf 6 festgelegt und es wird kein Pruning angewendet, was bedeutet, dass der Baum bis zu dieser Tiefe vollständig entwickelt wird.
Datenanalyse

Type : CREATION_INTERNE


Die Daten werden direkt im Skript über einen DATA-Schritt und die 'datalines'-Anweisung erstellt. Sie stammen weder aus SASHELP noch aus einer externen Datei.

1 Codeblock
DATA STEP Data
Erklärung :
Dieser Block ist ein DATA-Schritt, der die Tabelle 'MBE_Data' erstellt. Er definiert fünf Variablen mit ihren Labels und liest dann 20 Beobachtungen direkt aus dem Code mithilfe der 'datalines'-Anweisung. Die Daten werden standardmäßig in der WORK-Bibliothek gespeichert.
Kopiert!
1DATA MBE_Data;
2 label gTemp = 'Growth Temperature of Substrate';
3 label aTemp = 'Anneal Temperature';
4 label Rot = 'Rotation Speed';
5 label Dopant = 'Dopant Atom';
6 label Usable = 'Experiment Could Be Performed';
7 
8 INPUT gTemp aTemp Rot Dopant $ 39-40 Usable $ 47-54;
9 DATALINES;
10 384.614 633.172 1.01933 C Unusable
11 363.874 512.942 0.72057 C Unusable
12 397.395 671.179 0.90419 C Unusable
13 389.962 653.940 1.01417 C Unusable
14 387.763 612.545 1.00417 C Unusable
15 394.206 617.021 1.07188 Si Usable
16 387.135 616.035 0.94740 Si Usable
17 428.783 745.345 0.99087 Si Unusable
18 399.365 600.932 1.23307 Si Unusable
19 455.502 648.821 1.01703 Si Unusable
20 387.362 697.589 1.01623 Ge Usable
21 408.872 640.406 0.94543 Ge Usable
22 407.734 628.196 1.05137 Ge Usable
23 417.343 612.328 1.03960 Ge Usable
24 482.539 669.392 0.84249 Ge Unusable
25 367.116 564.246 0.99642 Sn Unusable
26 398.594 733.839 1.08744 Sn Unusable
27 378.032 619.561 1.06137 Sn Usable
28 357.544 606.871 0.85205 Sn Unusable
29 384.578 635.858 1.12215 Sn Unusable
30 ;
31RUN;
2 Codeblock
PROC HPSPLIT
Erklärung :
Dieser Block führt die HPSPLIT-Prozedur aus, um einen Klassifikationsbaum zu erstellen. Die Option 'data=MBE_Data' gibt die Eingabetabelle an. 'maxdepth=6' begrenzt die Tiefe des Baumes auf 6 Ebenen. Die 'class'-Anweisung deklariert 'Usable' und 'Dopant' als kategoriale Variablen. 'model' definiert 'Usable' als Zielvariable, die durch die anderen Variablen vorhergesagt werden soll. 'prune none' weist die Prozedur an, den Baum nicht zu beschneiden, wodurch seine vollständige Struktur bis zur angegebenen maximalen Tiefe erhalten bleibt.
Kopiert!
1PROC HPSPLIT DATA=MBE_Data maxdepth=6;
2 class Usable Dopant;
3 model Usable = gTemp aTemp Rot Dopant;
4 prune none;
5RUN;
Dieses Material wird von We Are Cas "wie besehen" zur Verfügung gestellt. Es gibt keine ausdrücklichen oder stillschweigenden Garantien hinsichtlich der Marktgängigkeit oder Eignung für einen bestimmten Zweck in Bezug auf die hierin enthaltenen Materialien oder Codes. We Are Cas ist nicht verantwortlich für Fehler in diesem Material, wie es jetzt existiert oder existieren wird, noch bietet We Are Cas technischen Support dafür an.
Urheberrechtsinformationen : S A S S A M P L E L I B R A R Y