countreg

countregFitModel

Beschreibung

Analysiert Regressionsmodelle, bei denen die abhängige Variable nicht-negative Ganzzahl- oder Zählwerte annimmt und typischerweise die Häufigkeit eines Ereignisses darstellt. Diese Aktion ist besonders nützlich für die Modellierung von Ereigniszähldaten, wie z.B. die Anzahl der Käufe eines Kunden, die Anzahl der aufgetretenen Fehler oder die Anzahl der Besuche auf einer Webseite. Sie unterstützt verschiedene Verteilungen wie Poisson, Negativ-Binomial und Conway-Maxwell-Poisson, einschließlich ihrer Zero-Inflated-Varianten.

countreg.countregFitModel <result=results> <status=rc> / bayes={bayesOptions}, bounds={"string-1" <, "string-2", ...>}, class={{classStatement-1} <, {classStatement-2}, ...>}, collection={{collection-1} <, {collection-2}, ...>}, display={displayTables}, dispmodel={cregdispmodelstmt}, extendparmlength=TRUE | FALSE, freq="variable-name", groupid="variable-name", includeinternalnames=TRUE | FALSE, initialvalues={"string-1" <, "string-2", ...>}, model={cregmodelstmt}, multimember={{multimember-1} <, {multimember-2}, ...>}, optimizer={optimizerOpts}, output={cregoutputStatement}, outputTables={outputTables}, polynomial={{polynomial-1} <, {polynomial-2}, ...>}, prior={{priorDetails-1} <, {priorDetails-2}, ...>}, restrictions={"string-1" <, "string-2", ...>}, selection={selectionStatement}, spline={{spline-1} <, {spline-2}, ...>}, store={casouttable}, table={castable}, tests={{singleTest-1} <, {singleTest-2}, ...>}, timingReport={timingReportOpts}, weight={cregweightvarOptions}, zeromodel={cregzeromodelstmt};
Einstellungen
ParameterBeschreibung
bayesGibt die Optionen für die Bayes'sche Analyse an.
boundsLegt einfache Randbedingungen für die Parameterschätzungen fest.
classGibt die Klassifikationsvariablen an.
collectionDefiniert eine Menge von Variablen, die als ein einziger Effekt mit mehreren Freiheitsgraden behandelt werden.
displayGibt eine Liste von Ergebnistabellen an, die zur Anzeige an den Client gesendet werden sollen.
dispmodelGibt die dispersionsbezogenen Regressoren an, die zur Modellierung der Dispersion verwendet werden.
extendparmlengthWenn auf True gesetzt, werden die Bezeichnungen für die Parameter in der Paramterschätzungstabelle nicht abgeschnitten.
freqGibt die Variable für die Beobachtungshäufigkeit an.
groupidGibt eine Identifikationsvariable an. Nur für Panel-Modelle mit festen und zufälligen Effekten verfügbar.
includeinternalnamesWenn auf True gesetzt, wird der Paramterschätzungstabelle eine zusätzliche Spalte mit den internen Namen für die Parameter hinzugefügt.
initialvaluesGibt Anfangswerte für Parameter in der Optimierung an.
modelGibt die abhängige Variable und die unabhängigen Regressorvariablen für das Regressionsmodell an.
multimemberVerwendet eine oder mehrere Klassifikationsvariablen so, dass jede Beobachtung mit einer oder mehreren Ebenen der Vereinigung der Ebenen der Klassifikationsvariablen verknüpft werden kann.
optimizerGibt Parameter an, die verschiedene Aspekte des Parameterschätzungsprozesses steuern.
outputGibt Details für eine Ausgabedatentabelle an, die Scores für verschiedene Statistiken enthalten soll.
outputTablesListet die Namen der Ergebnistabellen auf, die als CAS-Tabellen auf dem Server gespeichert werden sollen.
polynomialGibt einen polynomialen Effekt an. Alle angegebenen Variablen müssen numerisch sein.
priorGibt die A-priori-Verteilung für die Bayes'sche Analyse an.
restrictionsGibt lineare Restriktionen an, die den Parameterschätzungen auferlegt werden sollen.
selectionGibt die Methode zur Modellauswahl an.
splineErweitert Variablen in Spline-Basen, deren Form von den angegebenen Parametern abhängt.
storeSpeichert ein Regressionsmodell in einem Item-Store.
tableGibt die Eingabedatentabelle an.
testsGibt lineare Hypothesen über die Regressionsparameter an und welche Tests (Wald, Lagrange-Multiplikator und Likelihood-Ratio) durchgeführt werden sollen.
timingReportGibt an, welche Art von Zeitinformationen die Aktion bereitstellen soll.
weightGibt Details für die Beobachtungsgewichtungsvariable an.
zeromodelGibt die Zero-Inflated-Regressoren an, die die Wahrscheinlichkeit einer Null-Zählung bestimmen.
Erstellung von Beispieldaten

Erstellt eine Beispieltabelle 'artikelDaten' mit Daten über die Anzahl der von Autoren verfassten Artikel, unter Berücksichtigung ihres Bildungsprogramms und Geschlechts. Diese Daten eignen sich für die Zähldatenregression.

Kopiert!
1DATA casuser.artikelDaten;
2 LENGTH program $ 12;
3 DO program = 'Allgemein', 'Akademisch', 'Beruflich';
4 DO gender = 'M', 'F';
5 DO i = 1 to 20;
6 articles = int(rand('POISSON', 2 + (program='Akademisch')*2 + (gender='F')*0.5));
7 OUTPUT;
8 END;
9 END;
10 END;
11RUN;

Beispiele

Dieses Beispiel zeigt, wie ein einfaches Poisson-Regressionsmodell angepasst wird, um die Anzahl der Artikel (articles) basierend auf dem Programm (program) vorherzusagen.

SAS® / CAS-Code Code wartet auf Validierung durch die Community
Kopiert!
1PROC CAS;
2 countreg.countregFitModel /
3 TABLE={name='artikelDaten'},
4 model={depVars={{name='articles'}},
5 effects={{vars={'program'}}}
6 };
7RUN;
Ergebnis :
Die Ausgabe zeigt die Modellanpassungsstatistiken, die Parameter-Schätzungen für den Intercept und die 'program'-Variable, was den Einfluss des Programms auf die Anzahl der verfassten Artikel anzeigt.

Dieses Beispiel passt ein komplexeres ZINB-Modell an. Es modelliert die Anzahl der Artikel (articles) in Abhängigkeit von 'program' und 'gender' und verwendet 'gender' auch zur Modellierung der exzessiven Nullen (Zero-Inflation).

SAS® / CAS-Code Code wartet auf Validierung durch die Community
Kopiert!
1PROC CAS;
2 countreg.countregFitModel /
3 TABLE={name='artikelDaten'},
4 model={depVars={{name='articles'}},
5 effects={{vars={'program', 'gender'}}},
6 modelOptions={modelType='ZINB'}},
7 zeromodel={effects={{vars={'gender'}}}};
8RUN;
Ergebnis :
Die Ausgabe enthält die Anpassungsstatistiken für das ZINB-Modell, die Parameter-Schätzungen für das Zählmodell (Intercept, program, gender) und das Zero-Inflation-Modell (Intercept, gender). Dies ermöglicht eine detailliertere Analyse der Faktoren, die sowohl die Anzahl der Artikel als auch die Wahrscheinlichkeit, keine Artikel zu verfassen, beeinflussen.

FAQ

Was ist der Zweck der `countregFitModel`-Aktion?
Welche Arten von Modellen können mit dieser Aktion analysiert werden?
Wie kann ich ein Zero-Inflated-Modell (Modell mit Nullüberschuss) spezifizieren?
Unterstützt die `countregFitModel`-Aktion die Bayes'sche Analyse?
Wie kann ich die Kovarianzmatrix der Parameterschätzungen erhalten?