Diese Aktion passt lineare Regressionsmodelle mithilfe der Methode der kleinsten Quadrate an. Sie ist Teil des Regressions-Aktion-Sets und ermöglicht die Analyse linearer Beziehungen zwischen einer abhängigen Variablen und mehreren unabhängigen Variablen. Die Methode der kleinsten Quadrate wird verwendet, um die Parameter des Modells so zu schätzen, dass die Summe der quadrierten Residuen minimiert wird. Die Aktion bietet verschiedene Optionen zur Modellbildung, Variablenselektion und zur Ausgabe von Diagnoseinformationen, um eine umfassende Analyse zu ermöglichen.
| Parameter | Beschreibung |
|---|---|
| alpha | Gibt das Signifikanzniveau an, das für die Konstruktion aller Konfidenzintervalle verwendet werden soll. Standardwert: 0,05. Wertebereich: (0, 1). |
| attributes | Ändert die Attribute von Variablen, die in dieser Aktion verwendet werden. Derzeit werden Attribute, die in den Parametern 'inputs' und 'nominals' angegeben sind, ignoriert. (Unterparameter: format, formattedLength, label, name, nfd, nfl) |
| byLimit | Gibt an, dass die Analyse nicht durchgeführt wird, wenn die Anzahl der BY-Gruppen den angegebenen Wert überschreitet. Mindestwert: 1. |
| class | Benennt die Klassifikationsvariablen, die als erklärende Variablen in der Analyse verwendet werden sollen. (Unterparameter: countMissing, descending, ignoreMissing, levelizeRaw, maxLev, order, param, ref, split, vars) |
| classGlobalOpts | Listet Optionen auf, die für alle Klassifikationsvariablen gelten. (Unterparameter: countMissing, descending, ignoreMissing, levelizeRaw, maxLev, order, param, ref, split) |
| classLevelsPrint | Unterdrückt bei Festlegung auf „False“ die Anzeige der Klassenebenen. Standardwert: TRUE. |
| clb | Zeigt bei Festlegung auf „True“ die oberen und unteren Konfidenzgrenzen für die Parameterschätzungen an. Standardwert: FALSE. |
| code | Schreibt SAS DATA-Step-Code zur Berechnung vorhergesagter Werte des angepassten Modells. (Unterparameter: casOut, comment, fmtWdth, indentSize, intoCutPt, iProb, labelId, lineSize, noTrim, pCatAll, tabForm) |
| collection | Definiert einen Satz von Variablen, die als einzelner Effekt mit mehreren Freiheitsgraden behandelt werden. (Unterparameter: details, name, vars) |
| display | Gibt eine Liste von Ergebnistabellen an, die zur Anzeige an den Client gesendet werden sollen. (Unterparameter: caseSensitive, exclude, excludeAll, keyIsPath, names, pathType, traceNames) |
| freq | Benennt die numerische Variable, die die Häufigkeit des Auftretens jeder Beobachtung enthält. |
| inputs | Gibt Variablen an, die für die Analyse verwendet werden sollen. (Unterparameter: format, formattedLength, label, name, nfd, nfl) |
| maxParameters | Gibt an, dass Modelle nicht angepasst werden, wenn die Anzahl der Parameter den angegebenen Wert überschreitet. Mindestwert: 0. |
| model | Benennt die abhängige Variable, die erklärenden Effekte und die Modelloptionen. (Unterparameter: addlaststopstep, clb, depVars, effects, entry, include, informative, noint, ridge, ss3, start, stb, tol, vif, xpx, xpxScaled, xpxUnscaled) |
| multimember | Verwendet eine oder mehrere Klassifikationsvariablen, die im Parameter 'vars' angegeben sind, so dass jede Beobachtung einem oder mehreren Ebenen der Vereinigung der Ebenen der Klassifikationsvariablen zugeordnet werden kann. (Unterparameter: details, name, noEffect, stdize, vars, weight) |
| nClassLevelsPrint | Begrenzt die Anzeige von Klassenebenen. Der Wert 0 unterdrückt alle Ebenen. Mindestwert: 0. |
| nominals | Gibt nominale Variablen an, die für die Analyse verwendet werden sollen. (Unterparameter: format, formattedLength, label, name, nfd, nfl) |
| output | Erstellt eine Tabelle auf dem Server, die beobachtungsweise Statistiken enthält, die nach dem Anpassen des Modells berechnet werden. (Unterparameter: casOut, cooksD, copyVars, covRatio, dffits, h, lcl, lclm, likeDist, pred, press, resid, role, rStudent, stdi, stdp, stdr, student, ucl, uclm) |
| outputTables | Listet die Namen der Ergebnistabellen auf, die als CAS-Tabellen auf dem Server gespeichert werden sollen. (Unterparameter: groupByVarsRaw, includeAll, names, repeated, replace) |
| parmEstLevDetails | Gibt an, ob Roh- und formatierte Werte von Klassifikationsvariablen in der ParameterEstimates-Tabelle hinzugefügt werden sollen. Standardwert: RAW. |
| partByFrac | Gibt die Anteile der Daten an, die zur Validierung und zum Testen verwendet werden sollen. (Unterparameter: seed, test, validate) |
| partByVar | Benennt die Variable und ihre Werte, die zur Partitionierung der Daten in Trainings-, Validierungs- und Testrollen verwendet werden. (Unterparameter: name, test, train, validate) |
| polynomial | Gibt einen polynomialen Effekt an. Alle angegebenen Variablen müssen numerisch sein. Eine Designmatrixspalte wird für jeden Term des angegebenen Polynoms generiert. Standardmäßig wird jeder dieser Terme für den Zweck der Modellbildung als separater Effekt behandelt. (Unterparameter: degree, details, labelStyle, mDegree, name, noSeparate, standardize, vars) |
| selection | Gibt die Methode und Optionen zur Durchführung der Modellauswahl an. (Unterparameter: adaptive, bestSubsetOptions, candidates, choose, competitive, details, elasticNetOptions, enscale, ensteps, fcpSelectionOptions, gamma, hierarchy, kappa, L2, L2HIGH, L2LOW, lsCoeffs, maxEffects, maxSteps, method, minEffects, orderSelect, plots, relaxed, select, slEntry, slStay, stop, stopHorizon) |
| spline | Erweitert Variablen in Spline-Basen, deren Form von den angegebenen Parametern abhängt. (Unterparameter: basis, dataBoundary, degree, details, knotMax, knotMethod, knotMin, name, naturalCubic, separate, split, vars) |
| ss3 | Führt bei Festlegung auf „True“ eine Modellanalyse der Varianz basierend auf Typ-III-Quadratsummen durch. Standardwert: FALSE. |
| store | Speichert Regressionsmodelle in einem Binary Large Object (BLOB). (Unterparameter: caslib, compress, indexVars, label, lifetime, maxMemSize, memoryFormat, name, promote, replace, replication, tableRedistUpPolicy, threadBlockSize, timeStamp, where) |
| table | Gibt die Eingangsdatentabelle an. (Unterparameter: caslib, computedOnDemand, computedVars, computedVarsProgram, dataSourceOptions, groupBy, groupByMode, importOptions, name, orderBy, singlePass, vars, where, whereTable) |
| target | Gibt die Zielvariable an, die für die Analyse verwendet werden soll. |
| weight | Benennt die numerische Variable, die zur Durchführung einer gewichteten Analyse der Daten verwendet werden soll. |
Dies ist ein Platzhalter für die Datenerstellung. Es zeigt, wie eine einfache Tabelle für die Verwendung mit der glm-Aktion erstellt werden könnte.
| 1 | DATA mycas.example_data; |
| 2 | INPUT Y X1 X2 $; |
| 3 | DATALINES; |
| 4 | 10 1 A |
| 5 | 12 2 B |
| 6 | 15 3 A |
| 7 | 11 1 B |
| 8 | 13 2 A |
| 9 | ; |
| 10 | RUN; |
| 11 |
Dieses Beispiel zeigt, wie ein einfaches lineares Regressionsmodell mit der glm-Aktion angepasst wird, um die Beziehung zwischen einer numerischen abhängigen Variablen (Y) und einer numerischen unabhängigen Variablen (X1) zu analysieren.
| 1 | PROC CAS; |
| 2 | regression.glm / |
| 3 | TABLE='mycas.example_data', |
| 4 | model={depVars={{name='Y'}}, effects={{vars={'X1'}}}} |
| 5 | ; |
| 6 | RUN; |
| 7 |
Dieses erweiterte Beispiel demonstriert die Verwendung von Klassifikationsvariablen und Interaktionseffekten in einem linearen Regressionsmodell. Die abhängige Variable (Y) wird durch eine numerische Variable (X1) und eine Klassifikationsvariable (X2) sowie deren Interaktionseffekt vorhergesagt. Es zeigt auch, wie die Konfidenzintervalle für die Parameterschätzungen angezeigt werden.
| 1 | PROC CAS; |
| 2 | regression.glm / |
| 3 | TABLE='mycas.example_data', |
| 4 | class={{vars={'X2'}}}, |
| 5 | model={depVars={{name='Y'}}, effects={{vars={'X1'}}, {vars={'X2'}}, {vars={'X1', 'X2'}, interaction='CROSS'}}}, |
| 6 | clb=TRUE |
| 7 | ; |
| 8 | RUN; |
| 9 |