Erzeugt Histogramm-Bins und einfache bin-basierte Statistiken für numerische Variablen.
| Parameter | Beschreibung |
|---|---|
| casOutBinDetails | Gibt die Einstellungen für eine Ausgabetabelle an. Weitere Informationen zum Parameter 'casOutBinDetails' finden Sie im allgemeinen Parameter 'casouttable'. |
| freq | Gibt die Häufigkeitsvariable an. |
| includeMissingGroup | Wenn auf 'True' gesetzt, sind fehlende Werte als Gruppierungsschlüssel zulässig. |
| inputs | Gibt die Variablen an, die für die Analyse verwendet werden sollen. Sie können eine Untermenge der Variablen aus der Eingabetabelle angeben. Weitere Informationen zum Parameter 'inputs' finden Sie im allgemeinen Parameter 'casinvardesc'. |
| maxIterations | Gibt die maximale Anzahl von Iterationen für die iterativen robusten univariaten Statistiken wie MAD-Skala, GINI-Skala und Medcouple-Schiefen-Schätzungen an. Dieser Parameter kann verwendet werden, wenn die ZSCORE-Ausreißerdefinition verwendet wird. |
| nArgumentsForEachVar | Gibt die Anzahl der Argumente (Anforderungspakete) für jede Variable an. Wenn nicht festgelegt, werden alle Anforderungspakete für alle Variablen eingeschlossen. |
| outputTableOptions | Gibt Optionen für Ergebnistabellen an. Sie können angeben, welche Ergebnistabellen der Server zurückgibt und wie Gruppierungsergebnisse behandelt werden. Der Wert von 'outputTableOptions' kann einer oder mehrere der folgenden sein: 'forceTableReturn': Wenn auf 'True' gesetzt, werden Ergebnistabellen an den Client zurückgegeben, auch wenn die Ausgabe auch als Ausgabetabelle gespeichert wird. 'tableNames': Gibt die Namen der zu generierenden Ergebnistabellen an. Standardmäßig werden alle Ergebnistabellen zurückgegeben. |
| percentileDefinition | Gibt die zu verwendende Perzentildefinition an. Die Definitionen sind von 1 bis 6 nummeriert. Der Standardwert ist 6. |
| percentileMaxIterations | Gibt die maximale Anzahl von Iterationen für die Perzentilberechnung an. |
| percentileTolerance | Gibt die Toleranz für die Perzentilberechnung an. |
| requestPackages | Gibt ein Array von Histogramm-Anforderungspaketen an, die von der Aktion verarbeitet werden sollen. Sie können Anforderungspakete den Analysevariablen mit den Parametern 'nArgsForEachVar' und 'varsToArgsMap' zuordnen. Der Wert von 'histogramRequestPackage' kann einer oder mehrere der folgenden sein: 'allScaleTypes': Wenn auf 'True' gesetzt, werden alle Skalentypen berechnet. 'binEnd': Gibt die Endwerte des Bins an. Falls zutreffend, überschreiben sie die maximalen Datenwerte. 'binMapping': Steuert, wie Werte, die an der Grenze zwischen aufeinanderfolgenden Bins liegen, zugeordnet werden. 'LEFT' ermöglicht die Darstellung der Bins mit [], (], ..., (]-Notation. 'RIGHT' ermöglicht [), [), ..., []-Notation. 'binOutliers': Wenn auf 'True' gesetzt, werden Ausreißer in separate Bins gruppiert. Wenn n Bins für Nicht-Ausreißerwerte generiert werden, entsprechen die unteren und oberen Ausreißer-Bins den Bin-IDs n+1 bzw. n+2. 'binStart': Gibt die Startwerte des Bins an. Falls zutreffend, überschreiben sie die minimalen Datenwerte. 'binWidth': Gibt die Bin-Breite an. 'cutPoints': Gibt die vom Benutzer bereitgestellten Schnittpunkte für die 'CUTPTS'-Binning-Technik an. 'emptyBins': Wenn auf 'True' gesetzt, sind Bins mit null Beobachtungen zulässig. Standardmäßig werden führende und nachgestellte leere Bins entfernt. Andere leere Bins werden mit dem ersten nicht leeren Bin rechts zusammengefasst. 'globalBinWidth': Wenn auf 'True' gesetzt, verwenden alle Histogramme für eine Variable über alle Gruppierungsgruppen hinweg dieselben Bin-Grenzen. 'globalNObs': Gibt die Schätzung an, die für die Anzahl der Beobachtungen pro Gruppe verwendet werden soll. Dies ist für den 'Nicing'-Algorithmus erforderlich, um eine gemeinsame Bin-Breite über alle Gruppierungen hinweg zu bestimmen. 'integerBinning': Wenn auf 'True' gesetzt, werden Bin-Grenzen auf Ganzzahlen gezwungen. 'integerBinningLimit': Gibt eine Ganzzahl-Binning-Grenze an. Ganzzahl-Binning wird deaktiviert, wenn der Bereich der integralen Variablen größer als der angegebene Wert ist. 'method': Gibt den Typ des Histogramms für das Anforderungspaket an. 'CUTPTS': Erstellt Bins gemäß den vom Benutzer angegebenen Schnittpunkten. 'EQUALFREQ': Erstellt Bins mit gleicher Häufigkeit. 'EQUALWIDTH': Erstellt Bins mit gleicher Breite. 'nBins': Gibt die Anzahl der Bins an. Standardmäßig ist der Bin-Grenzwerte-'Nicing'-Algorithmus aktiviert. Der 'Nicing'-Algorithmus verwendet diesen Wert als Richtwert und kann eine andere Anzahl von Bins generieren. 'niceBinning': Wenn auf 'False' gesetzt, wird der 'Nice-Binning'-Algorithmus ausgesetzt und die Bin-Grenzen fallen nicht garantiert auf "schöne" Werte. 'outlierArguments': Gibt die Ausreißerdefinition und -behandlung an. Der Wert von 'outlierArguments' kann einer oder mehrere der folgenden sein: 'aadLocationUseMean': Wenn auf 'True' gesetzt, wird der Mittelwert anstelle des Medians als Zentrum für den Schätzer der absoluten durchschnittlichen Abweichung (AAD) verwendet. 'location': Gibt die Schätzmethode der Lage an. 'BIWEIGHT': Verwendet den auf 'Tukey-Biweight' basierenden Schätzer für die Lage. 'GEOMETRICMEAN': Verwendet das geometrische Mittel für die Lage. 'HARMONICMEAN': Verwendet das harmonische Mittel für die Lage. 'MEAN': Verwendet das arithmetische Mittel für die Lage. 'MEDIAN': Verwendet den Medianwert für die Lage. 'TRIMMEDMEAN': Verwendet das getrimmte Mittel für die Lage. Sie können Grenzen mit den Parametern 'lowerPerc', 'upperPerc' oder 'symPerc' angeben. 'WINSORIZEDMEAN': Verwendet das 'Winsorized'-Mittel für die Lage. Sie können Grenzen mit den Parametern 'lowerPerc', 'upperPerc' oder 'symPerc' angeben. 'locationBiweightTuning': Gibt den Tuning-Faktor für den 'Tukey-Biweight'-Lageschätzer an. 'lowerPercentile': Gibt den unteren Perzentil-Schwellenwert ('PERC'-Ausreißerdefinition) an. 'max': Gibt einen globalen Maximalwert an. 'min': Gibt einen globalen Minimalwert an. 'replacements': Gibt die Werte an, die als Ersatz für Ausreißer verwendet werden sollen. Dies können benutzerdefinierte Werte oder Lageschätzungen sein. 'scale': Gibt die zu verwendende Skalenmethode an. 'AAD': Verwendet die absolute Abweichung um den Mittelwert oder Median als Skala. 'BIWEIGHT': Verwendet den auf 'Tukey-Biweight' basierenden Schätzer für die Skala. 'GINI': Verwendet die 'Gini'-Skala für die Skala. 'IQR': Verwendet den Interquartilsbereich für die Skala. 'MAD': Verwendet die Median-Absolute-Abweichung um den Median für die Skala. 'STD': Verwendet die Standardabweichung für die Skala. 'scaleBiweightTuning': Gibt den Tuning-Faktor für den 'Tukey-Biweight'-Skalenschätzer an. 'scaleMultiplier': Gibt den Multiplikationsfaktor für den ausgewählten Skalenschätzer an. 'symmetricPercentile': Gibt den symmetrischen Perzentil-Schwellenwert an, der verwendet werden soll. Zum Beispiel bedeutet ein Wert von 20, dass ein unteres Perzentil auf 10 und das obere Perzentil auf 90 gesetzt wird. 'upperPercentile': Gibt den oberen Perzentil-Schwellenwert an, der verwendet werden soll. 'userDefinedLimits': Verwendet die angegebenen benutzerdefinierten Grenzen als untere und obere Schwellenwerte für jede Variable. 'zScoreThreshold': Gibt den Z-Schwellenwert an. 'outlierMethod': Gibt die Ausreißerdefinitionsmethode an. 'IQR': Verwendet den Interquartilsbereich zur Definition von Ausreißern. Verwenden Sie den Parameter 'scaleMulFac', um einen Multiplikationsfaktor festzulegen. 'MIQR': Verwendet einen robusten Interquartilsbereich zur Definition von Ausreißern. Die Robustifizierung wird erreicht, indem die unteren und oberen Schwellenwerte exponentiell von einem Quantil-Schiefemaß abhängen. 'MZSCORE': Verwendet den modifizierten Z-Score zur Definition von Ausreißern. Verwenden Sie die Parameter 'scale', 'loc', 'locBiweightTuning', 'scaleBiweightTuning', 'aadLocUseMean' oder 'scaleMulFac', um die Ausreißerdefinition zu steuern. 'PERC': Verwendet Perzentile zur Definition von Ausreißern. Verwenden Sie die Parameter 'lowerPerc', 'upperPerc' oder 'symPerc', um die Grenzen festzulegen. 'UDFLIMITS': Verwendet benutzerdefinierte Werte zur Definition von Ausreißern. Verwenden Sie die Parameter 'min', 'max' oder 'userDefLims', um die Grenzen festzulegen. 'ZSCORE': Verwendet den Z-Score zur Definition von Ausreißern. Verwendet den Mittelwert als Lage und die Standardabweichung als Skalenschätzer. 'outlierTreatment': Gibt an, wie mit Ausreißern umgegangen werden soll. 'REPLACE': Ausreißer werden durch benutzerdefinierte Werte oder Lageschätzungen ersetzt. 'TRIM': Ausreißer werden auf fehlend gesetzt und verworfen. 'WINSOR': Ausreißer werden durch den unteren oder oberen Schwellenwert ersetzt und dann gruppiert. 'round': Wenn auf 'True' gesetzt, wird eine Rundung auf Bin-Grenzen angewendet. 'roundFactor': Gibt den Rundungsfaktor an, der beim Runden von Werten verwendet werden soll. 'roundType': Gibt die Rundungsrichtung an. Wenn Sie beispielsweise einen Rundungsfaktor von 5 angeben, wird eine Bin-Grenze von 6,2 auf 10 AUFGERUNDET, auf 5 ABGERUNDET und auf 5 am NÄCHSTEN gerundet. 'scaleType': Gibt an, wie die Ergebnisse präsentiert werden sollen. 'PERCENT' verwendet den Bereich [0, 100]. 'DENSITY' und 'PROPORTION' verwenden [0, 1]. |
| table | Gibt den Tabellennamen, die Caslib und andere allgemeine Parameter an. Weitere Informationen zum Parameter 'table' finden Sie im allgemeinen Parameter 'castable'. |
| tolerance | Gibt die Toleranz für die iterativen robusten univariaten Statistiken an. |
| varsToArgumentsMap | Gibt an, welche Anforderungspakete für jede Variable berechnet werden sollen. Wenn für den Parameter 'nArgsForEachVar' ein Wert angegeben wird, muss dieser festgelegt werden. Andernfalls werden beide Parameter ignoriert und alle Anforderungspakete für alle Variablen berechnet. |
| weight | Gibt die Gewichtungsvariable an. |
Erstellt eine einfache Tabelle zur Demonstration der Histogramm-Aktion.
| 1 | DATA casuser.score; |
| 2 | DO i = 1 to 100; |
| 3 | x = rand('NORMAL', 0, 1); |
| 4 | OUTPUT; |
| 5 | END; |
| 6 | RUN;QUIT; |
Erzeugt ein Histogramm mit Standardeinstellungen für die Variable 'x'.
| 1 | |
| 2 | PROC CAS; |
| 3 | dataPreprocess.histogram / TABLE={name='score'}, inputs={{name='x'}}; |
| 4 | RUN; |
| 5 | QUIT; |
| 6 |
Erzeugt ein Histogramm für die Variable 'x' mit einer bestimmten Anzahl von Bins und einer benutzerdefinierten Bin-Breite.
| 1 | PROC CAS; |
| 2 | dataPreprocess.histogram / TABLE={name='score'}, |
| 3 | inputs={{name='x'}}, |
| 4 | requestPackages={{method='EQUALWIDTH', nBins=10, binWidth=0.5, binStart=-3, binEnd=3}}; |
| 5 | RUN;QUIT; |
Erzeugt ein Histogramm für die Variable 'x' und behandelt Ausreißer mit der 'ZSCORE'-Methode und ersetzt sie durch den Mittelwert.
| 1 | PROC CAS; |
| 2 | dataPreprocess.histogram / TABLE={name='score'}, |
| 3 | inputs={{name='x'}}, |
| 4 | requestPackages={{outlierMethod='ZSCORE', outlierTreatment='REPLACE', outlierArguments={replacements='MEAN'}}}; |
| 5 | RUN;QUIT; |