Le diagramme en boîte est l'outil standard pour évaluer la dispersion et identifier les anomalies, mais la présence de valeurs extrêmes (outliers) peut souvent tasser la boîte centrale, rendant l'analyse de la médiane et des quartiles illisible. La puissance de ce script réside dans l'utilisation de l'option CLIPFACTOR. En fixant ce facteur (ici à 1.5), vous demandez à SAS de tronquer l'axe vertical pour se focaliser sur le cœur de la distribution. L'élégance de la méthode tient à l'ajout de CLIPLEGEND, qui garantit la transparence statistique en indiquant clairement au lecteur le nombre de boîtes ayant été "clippées" (tronquées) pour des raisons de clarté visuelle.
Données 'Newtubes' créées via DATALINES avec des boucles imbriquées pour générer les identifiants de lots (Batch).
1 Bloc de code
DATA STEP Data
Explication : Création du jeu de données avec lecture en continu (@@) des valeurs de diamètre. Les boucles DO imbriquées génèrent la variable de groupe 'Batch' (15 lots) avec 5 observations par lot.
Explication : Génération d'un diagramme en boîte standard avec ODS Graphics activé. Affiche la distribution du diamètre pour chaque lot.
Copié !
ods graphics on;
title 'Box Plot for New Copper Tubes' ;
proc boxplot data=Newtubes;
plot Diameter*Batch / odstitle = title;
run;
1
ods graphics on;
2
title 'Box Plot for New Copper Tubes' ;
3
PROC BOXPLOTDATA=Newtubes;
4
plot Diameter*Batch / odstitle = title;
5
RUN;
3 Bloc de code
PROC BOXPLOT
Explication : Génération du diagramme avec l'option 'clipfactor=1.5'. Cette option tronque les boîtes dont les moustaches s'étendraient trop loin (valeurs extrêmes), permettant de zoomer sur la distribution centrale.
Copié !
title 'Box Plot for New Copper Tubes' ;
proc boxplot data=Newtubes;
plot Diameter*Batch /
odstitle = title
clipfactor = 1.5;
run;
1
title 'Box Plot for New Copper Tubes' ;
2
PROC BOXPLOTDATA=Newtubes;
3
plot Diameter*Batch /
4
odstitle = title
5
clipfactor = 1.5;
6
RUN;
4 Bloc de code
PROC BOXPLOT
Explication : Version enrichie du graphique tronqué. L'option 'cliplegend' ajoute une légende explicative et 'clipsubchar' définit le caractère '#' pour marquer les lots ayant subi une troncature.
Copié !
title 'Box Plot for New Copper Tubes' ;
proc boxplot data=Newtubes;
plot Diameter*Batch /
odstitle = title
clipfactor = 1.5
cliplegend = '# Clipped Boxes'
clipsubchar = '#';
run;
1
title 'Box Plot for New Copper Tubes' ;
2
PROC BOXPLOTDATA=Newtubes;
3
plot Diameter*Batch /
4
odstitle = title
5
clipfactor = 1.5
6
cliplegend = '# Clipped Boxes'
7
clipsubchar = '#';
8
RUN;
L'Astuce Pro
e défi majeur de la visualisation statistique réside dans la gestion des valeurs atypiques qui, bien que critiques, peuvent compresser l'échelle visuelle et masquer les variations subtiles du cœur de la distribution. Dans ce script, l'intelligence analytique repose sur l'utilisation de l'option CLIPFACTOR. Elle agit comme un régulateur de focale : en fixant un seuil de troncature (ici 1,5 fois la distance interquartile au-delà des moustaches), elle permet de "zoomer" sur la structure principale de vos lots de production sans supprimer les données.
Cependant, tronquer un graphique sans avertir le lecteur est une erreur de communication de données. L'astuce technique indispensable ici est le couplage de CLIPLEGEND et CLIPSUBCHAR. Cette combinaison automatise la transparence statistique en affichant une légende dynamique qui remplace le caractère # par le nombre réel de boîtes impactées. Vous obtenez ainsi un rapport à la fois esthétique, lisible et rigoureux, garantissant que les déviances extrêmes sont signalées sans compromettre l'analyse visuelle globale.
Ce matériel est fourni "tel quel" par We Are Cas. Il n'y a aucune garantie, expresse ou implicite, quant à la qualité marchande ou à l'adéquation à un usage particulier concernant le matériel ou le code contenu dans les présentes. We Are Cas n'est pas responsable des erreurs dans ce matériel tel qu'il existe maintenant ou existera, et We Are Cas ne fournit pas de support technique pour celui-ci.
SAS et tous les autres noms de produits ou de services de SAS Institute Inc. sont des marques déposées ou des marques de commerce de SAS Institute Inc. aux États-Unis et dans d'autres pays. ® indique un enregistrement aux États-Unis. WeAreCAS est un site communautaire indépendant et n'est pas affilié à SAS Institute Inc.
Ce site utilise des cookies techniques et analytiques pour améliorer votre expérience.
En savoir plus.