Publicado el :
Estadística CREATION_INTERNE

Ejemplo de documentación 5 para PROC HPSPLIT

Este código también está disponible en: Deutsch English Français
En espera de validación
Este script ilustra el uso del procedimiento HPSPLIT, un procedimiento de estadísticas de alto rendimiento. Comienza creando un conjunto de datos llamado 'MBE_Data' que contiene información sobre experimentos. Luego, aplica un modelo de árbol de clasificación para predecir la variable 'Usable' en función de las otras variables. La profundidad máxima del árbol se fija en 6 y no se aplica ninguna poda, lo que significa que el árbol se desarrollará completamente hasta esa profundidad.
Análisis de datos

Type : CREATION_INTERNE


Los datos se crean directamente en el script a través de un paso DATA y la instrucción 'datalines'. No provienen de SASHELP ni de un archivo externo.

1 Bloque de código
DATA STEP Data
Explicación :
Este bloque es un paso DATA que crea la tabla 'MBE_Data'. Define cinco variables con sus etiquetas, luego lee 20 observaciones directamente del código usando la instrucción 'datalines'. Los datos se almacenan en la librería WORK por defecto.
¡Copiado!
1DATA MBE_Data;
2 label gTemp = 'Growth Temperature of Substrate';
3 label aTemp = 'Anneal Temperature';
4 label Rot = 'Rotation Speed';
5 label Dopant = 'Dopant Atom';
6 label Usable = 'Experiment Could Be Performed';
7 
8 INPUT gTemp aTemp Rot Dopant $ 39-40 Usable $ 47-54;
9 DATALINES;
10 384.614 633.172 1.01933 C Unusable
11 363.874 512.942 0.72057 C Unusable
12 397.395 671.179 0.90419 C Unusable
13 389.962 653.940 1.01417 C Unusable
14 387.763 612.545 1.00417 C Unusable
15 394.206 617.021 1.07188 Si Usable
16 387.135 616.035 0.94740 Si Usable
17 428.783 745.345 0.99087 Si Unusable
18 399.365 600.932 1.23307 Si Unusable
19 455.502 648.821 1.01703 Si Unusable
20 387.362 697.589 1.01623 Ge Usable
21 408.872 640.406 0.94543 Ge Usable
22 407.734 628.196 1.05137 Ge Usable
23 417.343 612.328 1.03960 Ge Usable
24 482.539 669.392 0.84249 Ge Unusable
25 367.116 564.246 0.99642 Sn Unusable
26 398.594 733.839 1.08744 Sn Unusable
27 378.032 619.561 1.06137 Sn Usable
28 357.544 606.871 0.85205 Sn Unusable
29 384.578 635.858 1.12215 Sn Unusable
30 ;
31RUN;
2 Bloque de código
PROC HPSPLIT
Explicación :
Este bloque ejecuta el procedimiento HPSPLIT para construir un árbol de clasificación. La opción 'data=MBE_Data' especifica la tabla de entrada. 'maxdepth=6' limita la profundidad del árbol a 6 niveles. La instrucción 'class' declara 'Usable' y 'Dopant' como variables categóricas. 'model' define 'Usable' como la variable objetivo a predecir por las otras variables. 'prune none' instruye al procedimiento a no podar el árbol, conservando su estructura completa hasta la profundidad máxima especificada.
¡Copiado!
1PROC HPSPLIT DATA=MBE_Data maxdepth=6;
2 class Usable Dopant;
3 model Usable = gTemp aTemp Rot Dopant;
4 prune none;
5RUN;
Este material se proporciona "tal cual" por We Are Cas. No hay garantías, expresas o implícitas, en cuanto a la comerciabilidad o idoneidad para un propósito particular con respecto a los materiales o el código contenidos en este documento. We Are Cas no es responsable de los errores en este material tal como existe ahora o existirá, ni We Are Cas proporciona soporte técnico para el mismo.
Información de copyright : S A S S A M P L E L I B R A R Y