countreg

countregFitModel

Beschreibung

Analysiert Regressionsmodelle, bei denen die abhängige Variable nicht-negative Ganzzahl- oder Zählwerte annimmt und typischerweise die Häufigkeit eines Ereignisses darstellt. Diese Aktion ist besonders nützlich für die Modellierung von Ereigniszähldaten, wie z.B. die Anzahl der Käufe eines Kunden, die Anzahl der aufgetretenen Fehler oder die Anzahl der Besuche auf einer Webseite. Sie unterstützt verschiedene Verteilungen wie Poisson, Negativ-Binomial und Conway-Maxwell-Poisson, einschließlich ihrer Zero-Inflated-Varianten.

countreg.countregFitModel <result=results> <status=rc> / bayes={bayesOptions}, bounds={"string-1" <, "string-2", ...>}, class={{classStatement-1} <, {classStatement-2}, ...>}, collection={{collection-1} <, {collection-2}, ...>}, display={displayTables}, dispmodel={cregdispmodelstmt}, extendparmlength=TRUE | FALSE, freq="variable-name", groupid="variable-name", includeinternalnames=TRUE | FALSE, initialvalues={"string-1" <, "string-2", ...>}, model={cregmodelstmt}, multimember={{multimember-1} <, {multimember-2}, ...>}, optimizer={optimizerOpts}, output={cregoutputStatement}, outputTables={outputTables}, polynomial={{polynomial-1} <, {polynomial-2}, ...>}, prior={{priorDetails-1} <, {priorDetails-2}, ...>}, restrictions={"string-1" <, "string-2", ...>}, selection={selectionStatement}, spline={{spline-1} <, {spline-2}, ...>}, store={casouttable}, table={castable}, tests={{singleTest-1} <, {singleTest-2}, ...>}, timingReport={timingReportOpts}, weight={cregweightvarOptions}, zeromodel={cregzeromodelstmt};
Einstellungen
ParameterBeschreibung
bayes Gibt die Optionen für die Bayes'sche Analyse an.
bounds Legt einfache Randbedingungen für die Parameterschätzungen fest.
class Gibt die Klassifikationsvariablen an.
collection Definiert eine Menge von Variablen, die als ein einziger Effekt mit mehreren Freiheitsgraden behandelt werden.
display Gibt eine Liste von Ergebnistabellen an, die zur Anzeige an den Client gesendet werden sollen.
dispmodel Gibt die dispersionsbezogenen Regressoren an, die zur Modellierung der Dispersion verwendet werden.
extendparmlength Wenn auf True gesetzt, werden die Bezeichnungen für die Parameter in der Paramterschätzungstabelle nicht abgeschnitten.
freq Gibt die Variable für die Beobachtungshäufigkeit an.
groupid Gibt eine Identifikationsvariable an. Nur für Panel-Modelle mit festen und zufälligen Effekten verfügbar.
includeinternalnames Wenn auf True gesetzt, wird der Paramterschätzungstabelle eine zusätzliche Spalte mit den internen Namen für die Parameter hinzugefügt.
initialvalues Gibt Anfangswerte für Parameter in der Optimierung an.
model Gibt die abhängige Variable und die unabhängigen Regressorvariablen für das Regressionsmodell an.
multimember Verwendet eine oder mehrere Klassifikationsvariablen so, dass jede Beobachtung mit einer oder mehreren Ebenen der Vereinigung der Ebenen der Klassifikationsvariablen verknüpft werden kann.
optimizer Gibt Parameter an, die verschiedene Aspekte des Parameterschätzungsprozesses steuern.
output Gibt Details für eine Ausgabedatentabelle an, die Scores für verschiedene Statistiken enthalten soll.
outputTables Listet die Namen der Ergebnistabellen auf, die als CAS-Tabellen auf dem Server gespeichert werden sollen.
polynomial Gibt einen polynomialen Effekt an. Alle angegebenen Variablen müssen numerisch sein.
prior Gibt die A-priori-Verteilung für die Bayes'sche Analyse an.
restrictions Gibt lineare Restriktionen an, die den Parameterschätzungen auferlegt werden sollen.
selection Gibt die Methode zur Modellauswahl an.
spline Erweitert Variablen in Spline-Basen, deren Form von den angegebenen Parametern abhängt.
store Speichert ein Regressionsmodell in einem Item-Store.
table Gibt die Eingabedatentabelle an.
tests Gibt lineare Hypothesen über die Regressionsparameter an und welche Tests (Wald, Lagrange-Multiplikator und Likelihood-Ratio) durchgeführt werden sollen.
timingReport Gibt an, welche Art von Zeitinformationen die Aktion bereitstellen soll.
weight Gibt Details für die Beobachtungsgewichtungsvariable an.
zeromodel Gibt die Zero-Inflated-Regressoren an, die die Wahrscheinlichkeit einer Null-Zählung bestimmen.
Erstellung von Beispieldaten

Erstellt eine Beispieltabelle 'artikelDaten' mit Daten über die Anzahl der von Autoren verfassten Artikel, unter Berücksichtigung ihres Bildungsprogramms und Geschlechts. Diese Daten eignen sich für die Zähldatenregression.

Kopiert!
1DATA casuser.artikelDaten;
2 LENGTH program $ 12;
3 DO program = 'Allgemein', 'Akademisch', 'Beruflich';
4 DO gender = 'M', 'F';
5 DO i = 1 to 20;
6 articles = int(rand('POISSON', 2 + (program='Akademisch')*2 + (gender='F')*0.5));
7 OUTPUT;
8 END;
9 END;
10 END;
11RUN;

Beispiele

Dieses Beispiel zeigt, wie ein einfaches Poisson-Regressionsmodell angepasst wird, um die Anzahl der Artikel (articles) basierend auf dem Programm (program) vorherzusagen.

SAS® / CAS-Code Code wartet auf Validierung durch die Community
Kopiert!
1PROC CAS;
2 countreg.countregFitModel /
3 TABLE={name='artikelDaten'},
4 model={depVars={{name='articles'}},
5 effects={{vars={'program'}}}
6 };
7RUN;
Ergebnis :
Die Ausgabe zeigt die Modellanpassungsstatistiken, die Parameter-Schätzungen für den Intercept und die 'program'-Variable, was den Einfluss des Programms auf die Anzahl der verfassten Artikel anzeigt.

Dieses Beispiel passt ein komplexeres ZINB-Modell an. Es modelliert die Anzahl der Artikel (articles) in Abhängigkeit von 'program' und 'gender' und verwendet 'gender' auch zur Modellierung der exzessiven Nullen (Zero-Inflation).

SAS® / CAS-Code Code wartet auf Validierung durch die Community
Kopiert!
1PROC CAS;
2 countreg.countregFitModel /
3 TABLE={name='artikelDaten'},
4 model={depVars={{name='articles'}},
5 effects={{vars={'program', 'gender'}}},
6 modelOptions={modelType='ZINB'}},
7 zeromodel={effects={{vars={'gender'}}}};
8RUN;
Ergebnis :
Die Ausgabe enthält die Anpassungsstatistiken für das ZINB-Modell, die Parameter-Schätzungen für das Zählmodell (Intercept, program, gender) und das Zero-Inflation-Modell (Intercept, gender). Dies ermöglicht eine detailliertere Analyse der Faktoren, die sowohl die Anzahl der Artikel als auch die Wahrscheinlichkeit, keine Artikel zu verfassen, beeinflussen.

FAQ

Was ist der Zweck der `countregFitModel`-Aktion?
Welche Arten von Modellen können mit dieser Aktion analysiert werden?
Wie kann ich ein Zero-Inflated-Modell (Modell mit Nullüberschuss) spezifizieren?
Unterstützt die `countregFitModel`-Aktion die Bayes'sche Analyse?
Wie kann ich die Kovarianzmatrix der Parameterschätzungen erhalten?

Zugehörige Szenarien

Anwendungsfall
Prognose von Versicherungsansprüchen mit Zero-Inflated Modellen

Eine Kfz-Versicherungsgesellschaft möchte die Anzahl der Schadensfälle pro Kunde vorhersagen. Da die Mehrheit der Kunden (ca. 90%) keinen Unfall hat, gibt es ein Übermaß an Null...

Anwendungsfall
Performance-Analyse bei hohem Datenvolumen (High-Volume Traffic)

Ein großer E-Commerce-Händler analysiert die Anzahl der Artikel im Warenkorb ('cart_items') basierend auf Millionen von Websitzungen. Das Ziel ist es, die Robustheit der 'countr...

Anwendungsfall
Qualitätskontrolle mit Bayes'scher Analyse bei kleinen Datenmengen

In einer spezialisierten Fertigungsanlage werden selten auftretende Defekte an Präzisionsteilen analysiert. Da nur wenige Datenpunkte (Chargen) vorhanden sind, möchte der Qualit...