Die Beispiele verwenden generierte Daten (Datalines) oder SASHELP-Tabellen, um die Autonomie jedes Codeblocks zu gewährleisten.
1 Codeblock
PROC BINNING Data
Erklärung : Dieses Beispiel erstellt eine einfache Datentabelle 'auto_data' in der CASUSER-Bibliothek. Anschließend wird die BINNING-Prozedur mit der CUTPTS-Methode für die Variable 'Horsepower' verwendet. Schnittpunkte bei 180 und 200 werden angegeben, wodurch drei Kategorien entstehen: Horsepower <= 180, 180 < Horsepower <= 200 und Horsepower > 200. Die Ausgabetabelle 'binned_data' enthält die neue binäre Variable sowie die kopierten Originalvariablen. Die Ergebnisse werden dann für die ersten Beobachtungen angezeigt und eine Häufigkeitsanalyse wird für die binäre Variable durchgeführt, um die Klassifizierung zu überprüfen.
Erklärung : Dieses Beispiel veranschaulicht die Klassifizierung nach Schnittpunkten für zwei Variablen, 'SqFt' und 'YearBuilt', aus einer Datentabelle 'house_prices'. Die Option MONITOR=(SalePrice) wird für die Variable 'SqFt' verwendet, um die Variable 'SalePrice' in den Bin-Statistiken zu verfolgen, was für die Bewertung der Klassifizierungsleistung nützlich ist. Die Option OUTSTAT generiert eine zusätzliche Tabelle 'bin_stats', die die Statistiken jedes Bins enthält und eine detaillierte Ansicht der Gruppierungsergebnisse bietet.
Erklärung : Dieses fortgeschrittene Beispiel verwendet eine Kundendatentabelle mit fehlenden Werten. Für die Variable 'Age' werden spezifische Schnittpunkte (30, 40, 50) definiert. Für 'Income_Monthly' gibt die Option HANDLEMISSING=BIN an, dass fehlende Werte als eine separate Bin-Kategorie behandelt werden sollen, obwohl Schnittpunkte angegeben sind. Dies zeigt einen robusteren Ansatz für die Datengruppierung unter Berücksichtigung realer Szenarien unvollständiger Daten.
Kopiert!
/* Création d'une table CAS temporaire avec des valeurs manquantes */
options casdatalimit=1000;
caslib _all_ assign;
data casuser.customer_data;
input Age Income_Monthly Education_Level $ Credit_Score_PreBinning Gender $;
datalines;
30 3000 Bac NA . M
45 5000 Master NA 750 F
25 2000 HighSchool NA 600 M
NA 4000 PhD NA 800 F
35 NA Bachelor NA 700 M
50 6000 Master NA 850 F
28 2500 HighSchool NA 620 M
40 4500 Bachelor NA 720 F
NA 3500 PhD NA 780 M
32 3200 HighSchool NA 680 F
;
run;
/* Application du découpage avec gestion des manquantes et différentes numbin */
proc binning data=casuser.customer_data numbin=5 method=cutpts;
input Age / cutpts(30, 40, 50);
input Income_Monthly / numbin=3 cutpts(3000, 5000) handlemissing=bin;
output out=casuser.binned_customer_data copyvars=(Age Income_Monthly Credit_Score_PreBinning);
run;
/* Affichage des résultats pour les données binées */
proc print data=casuser.binned_customer_data;
run;
/* Vérification des fréquences pour les variables binées */
proc freq data=casuser.binned_customer_data;
tables Binned_Age Binned_Income_Monthly;
run;
1
/* Création d'une table CAS temporaire avec des valeurs manquantes */
2
options casdatalimit=1000;
3
caslib _all_ assign;
4
5
DATA casuser.customer_data;
6
INPUT Age Income_Monthly Education_Level $ Credit_Score_PreBinning Gender $;
7
DATALINES;
8
303000 Bac NA . M
9
455000 Master NA 750 F
10
252000 HighSchool NA 600 M
11
NA 4000 PhD NA 800 F
12
35 NA Bachelor NA 700 M
13
506000 Master NA 850 F
14
282500 HighSchool NA 620 M
15
404500 Bachelor NA 720 F
16
NA 3500 PhD NA 780 M
17
323200 HighSchool NA 680 F
18
;
19
RUN;
20
21
/* Application du découpage avec gestion des manquantes et différentes numbin */
/* Affichage des résultats pour les données binées */
29
PROC PRINTDATA=casuser.binned_customer_data;
30
RUN;
31
32
/* Vérification des fréquences pour les variables binées */
33
PROC FREQDATA=casuser.binned_customer_data;
34
tables Binned_Age Binned_Income_Monthly;
35
RUN;
36
4 Codeblock
PROC BINNING
Erklärung : Dieses Beispiel demonstriert die Integration von PROC BINNING in die SAS Viya/CAS-Umgebung. Es lädt die Tabelle 'iris' aus SASHELP in eine CAS-Bibliothek. Anschließend wendet es die Klassifizierung nach Schnittpunkten auf 'PetalLength' und 'SepalWidth' an und speichert den Klassifizierungsstatus (die Binning-Regeln) in einer Tabelle 'binning_state' mit der Option SAVE STATE. Dieser 'Status' kann wiederverwendet werden, um genau dieselben Klassifizierungsregeln (Scoring) auf neue Daten anzuwenden, ohne die Schnittpunkte neu definieren zu müssen. Die Tabelle 'scored_iris' zeigt das Ergebnis des Binnings für die neuen Daten.
Kopiert!
/* Assurez-vous d'avoir une session CAS active et une caslib assignée */
options casdatalimit=1000;
caslib _all_ assign;
/* Charger des données SASHELP dans CAS pour l'exemple */
data casuser.iris;
set sashelp.iris;
run;
/* Application du découpage par points de coupure sur une table CAS */
proc binning data=casuser.iris numbin=3 method=cutpts;
input PetalLength / cutpts(1.5, 4.5);
input SepalWidth / cutpts(3.0, 3.5);
output out=casuser.binned_iris (replace=true) copyvars=(Species PetalLength SepalWidth);
save state out=casuser.binning_state (replace=true);
run;
/* Appliquer le découpage sur de nouvelles données (scoring) */
data casuser.new_iris_data;
input PetalLength SepalWidth Species $;
datalines;
1.2 3.8 Setosa
5.0 3.0 Virginica
4.0 2.5 Versicolor
;
run;
proc binning data=casuser.new_iris_data;
score state=casuser.binning_state out=casuser.scored_iris;
run;
proc print data=casuser.scored_iris;
run;
1
/* Assurez-vous d'avoir une session CAS active et une caslib assignée */
2
options casdatalimit=1000;
3
caslib _all_ assign;
4
5
/* Charger des données SASHELP dans CAS pour l'exemple */
6
DATA casuser.iris;
7
SET sashelp.iris;
8
RUN;
9
10
/* Application du découpage par points de coupure sur une table CAS */
Dieses Material wird von We Are Cas "wie besehen" zur Verfügung gestellt. Es gibt keine ausdrücklichen oder stillschweigenden Garantien hinsichtlich der Marktgängigkeit oder Eignung für einen bestimmten Zweck in Bezug auf die hierin enthaltenen Materialien oder Codes. We Are Cas ist nicht verantwortlich für Fehler in diesem Material, wie es jetzt existiert oder existieren wird, noch bietet We Are Cas technischen Support dafür an.
SAS und alle anderen Produkt- oder Dienstleistungsnamen von SAS Institute Inc. sind eingetragene Marken oder Marken von SAS Institute Inc. in den USA und anderen Ländern. ® zeigt die Registrierung in den USA an. WeAreCAS ist eine unabhängige Community-Site und nicht mit SAS Institute Inc. verbunden.
Diese Website verwendet technische und analytische Cookies, um Ihre Erfahrung zu verbessern.
Mehr erfahren.