Ce script analyse des données d'essai biologique (Ames salmonella assay). Il commence par créer un jeu de données interne, puis ajuste plusieurs modèles : une régression de Poisson simple, un modèle de mélange de Poisson à deux composants avec des effets contraints (via EQUATE et RESTRICT), et examine enfin l'impact d'une valeur aberrante en réajustant les modèles sur un sous-ensemble de données.
Analyse des données
Type : CREATION_INTERNE
Les données 'assay' sont créées directement dans le script à l'aide d'une étape DATA et de l'instruction DATALINES.
1 Bloc de code
DATA STEP Data
Explication : Création du jeu de données 'assay' contenant les doses de quinoléine et le nombre de colonies observées. La variable 'logd' (log de la dose) est calculée.
Copié !
data assay;
label dose = 'Dose of quinoline (microg/plate)'
num = 'Observed number of colonies';
input dose @;
logd = log(dose+10);
do i=1 to 3; input num @; output; end;
datalines;
0 15 21 29
10 16 18 21
33 16 26 33
100 27 41 60
333 33 38 41
1000 20 27 42
;
1
DATA assay;
2
label dose = 'Dose of quinoline (microg/plate)'
3
num = 'Observed number of colonies';
4
INPUT dose @;
5
logd = log(dose+10);
6
DO i=1 to 3; INPUT num @; OUTPUT; END;
7
DATALINES;
8
0 152129
9
10161821
10
33162633
11
100274160
12
333333841
13
1000202742
14
;
2 Bloc de code
PROC FMM
Explication : Ajustement d'un modèle de régression de Poisson standard (k=1 par défaut) pour modéliser le nombre de colonies en fonction de la dose.
Copié !
proc fmm data=assay;
model num = dose logd / dist=Poisson;
run;
1
2
PROC FMM
3
DATA=assay;
4
model num = dose logd / dist=Poisson;
5
RUN;
6
3 Bloc de code
PROC FMM
Explication : Ajustement d'un modèle de mélange de Poisson à deux composants (k=2). L'option 'equate=effects(dose logd)' impose que les coefficients de régression pour 'dose' et 'logd' soient identiques dans les deux composants du mélange.
Copié !
proc fmm data=assay;
model num = dose logd / dist=Poisson k=2
equate=effects(dose logd);
run;
1
PROC FMMDATA=assay;
2
model num = dose logd / dist=Poisson k=2
3
equate=effects(dose logd);
4
RUN;
4 Bloc de code
PROC FMM
Explication : Alternative à l'option EQUATE utilisant l'instruction RESTRICT pour forcer l'égalité des paramètres entre les deux composants (dose 1 = dose 2 et logd 1 = logd 2).
Explication : Réajustement du modèle de mélange de Poisson (k=2) en excluant une observation aberrante (num=60) pour voir son impact sur l'ajustement.
Copié !
proc fmm data=assay(where=(num ne 60));
model num = dose logd / dist=Poisson k=2
equate=effects(dose logd);
run;
1
PROC FMMDATA=assay(where=(num ne 60));
2
model num = dose logd / dist=Poisson k=2
3
equate=effects(dose logd);
4
RUN;
6 Bloc de code
PROC FMM
Explication : Réajustement du modèle de Poisson simple en excluant l'observation aberrante.
Copié !
proc fmm data=assay(where=(num ne 60));
model num = dose logd / dist=Poisson;
run;
1
2
PROC FMM
3
DATA=assay(where=(num ne 60));
4
model num = dose logd / dist=Poisson;
5
RUN;
6
Ce matériel est fourni "tel quel" par We Are Cas. Il n'y a aucune garantie, expresse ou implicite, quant à la qualité marchande ou à l'adéquation à un usage particulier concernant le matériel ou le code contenu dans les présentes. We Are Cas n'est pas responsable des erreurs dans ce matériel tel qu'il existe maintenant ou existera, et We Are Cas ne fournit pas de support technique pour celui-ci.
« La procédure PROC FMM (Finite Mixture Models) est un outil de pointe pour traiter les données de comptage qui s'écartent du modèle de Poisson classique, souvent à cause d'une surdispersion ou de sous-populations cachées. Dans cet essai biologique, l'utilisation d'un modèle de mélange à deux composants ($k=2$) permet de distinguer les comportements types des réponses atypiques. L'astuce technique majeure réside dans l'option EQUATE ou l'instruction RESTRICT : elles permettent de forcer les pentes des variables explicatives (dose et log-dose) à être identiques entre les groupes, isolant ainsi la variabilité sur l'ordonnée à l'origine. Cette méthode est particulièrement efficace pour détecter si une valeur extrême (comme num=60) biaise l'ensemble du modèle ou si elle appartient simplement à une composante secondaire du mélange. »
SAS et tous les autres noms de produits ou de services de SAS Institute Inc. sont des marques déposées ou des marques de commerce de SAS Institute Inc. aux États-Unis et dans d'autres pays. ® indique un enregistrement aux États-Unis. WeAreCAS est un site communautaire indépendant et n'est pas affilié à SAS Institute Inc.
Ce site utilise des cookies techniques et analytiques pour améliorer votre expérience.
En savoir plus.