Publié le :
Statistique CREATION_INTERNE

Exemple d'introduction à PROC LOESS : Incidences de mélanomes

Ce code est également disponible en : Deutsch English Español
En attente de validation
Ce script crée un jeu de données 'Melanoma' contenant des relevés annuels. Il commence par visualiser les données brutes avec PROC SGPLOT. Ensuite, il utilise PROC LOESS de manière progressive : d'abord avec les paramètres par défaut, puis en demandant des détails statistiques, en comparant différents paramètres de lissage (option smooth), en exportant les résultats via ODS OUTPUT, et enfin en affichant des intervalles de confiance (CLM).
Analyse des données

Type : CREATION_INTERNE


Les données sont incluses directement dans le script via l'instruction DATALINES (jeu de données 'Melanoma').

1 Bloc de code
DATA STEP Data
Explication :
Création du jeu de données 'Melanoma'. L'instruction INPUT est configurée pour lire des paires 'Année Incidence' multiples par ligne (note : le code source contient un artefact de référence de fichier là où le symbole '@@' est attendu pour la lecture en continu).
Copié !
1DATA Melanoma;
2 INPUT Year Incidences @code_sas_json/8_SAS_Intro_ReadFile_MultiCol_@@.json;
3 FORMAT Year d4.0;
4 DATALINES;
51936 0.9 1937 0.8 1938 0.8 1939 1.3
61940 1.4 1941 1.2 1942 1.7 1943 1.8
71944 1.6 1945 1.5 1946 1.5 1947 2.0
81948 2.5 1949 2.7 1950 2.9 1951 2.5
91952 3.1 1953 2.4 1954 2.2 1955 2.9
101956 2.5 1957 2.6 1958 3.2 1959 3.8
111960 4.2 1961 3.9 1962 3.7 1963 3.3
121964 3.7 1965 3.9 1966 4.1 1967 3.8
131968 4.7 1969 4.4 1970 4.8 1971 4.8
141972 4.8
15;
2 Bloc de code
PROC SGPLOT
Explication :
Génération d'un nuage de points (scatter plot) pour visualiser l'évolution des incidences en fonction de l'année avant modélisation.
Copié !
1 
2PROC SGPLOT
3DATA=Melanoma;
4scatter y=Incidences x=Year;
5RUN;
6 
3 Bloc de code
PROC LOESS
Explication :
Activation des graphiques ODS. Première exécution de PROC LOESS avec les options par défaut pour ajuster une courbe de régression locale.
Copié !
1ods graphics on;
2 
3PROC LOESS DATA=Melanoma;
4 model Incidences=Year;
5RUN;
4 Bloc de code
PROC LOESS
Explication :
Exécution de PROC LOESS avec demande de détails supplémentaires dans la sortie : résumé du modèle et statistiques de sortie.
Copié !
1 
2PROC LOESS
3DATA=Melanoma;
4model Incidences=Year / details(ModelSummary OutputStatistics);
5RUN;
6 
5 Bloc de code
PROC LOESS Data
Explication :
Modélisation avec spécification explicite de plusieurs paramètres de lissage (smooth) pour comparaison. L'option 'residual' demande le calcul des résidus. Les statistiques de sortie sont sauvegardées dans la table SAS 'Results' via ODS OUTPUT.
Copié !
1PROC LOESS DATA=Melanoma;
2 model Incidences=Year/smooth=0.1 0.25 0.4 0.6 residual;
3 ods OUTPUT OutputStatistics=Results;
4RUN;
6 Bloc de code
PROC PRINT
Explication :
Affichage des 5 premières observations de la table 'Results' créée précédemment.
Copié !
1PROC PRINT DATA=Results(obs=5);
2 id obs;
3RUN;
7 Bloc de code
PROC LOESS
Explication :
Exécution visant à produire un graphique spécifique des résidus par paramètre de lissage (ResidualsBySmooth).
Copié !
1 
2PROC LOESS
3DATA=Melanoma plots=ResidualsBySmooth(smooth);
4model Incidences=Year/smooth=0.1 0.25 0.4 0.6;
5RUN;
6 
8 Bloc de code
PROC LOESS
Explication :
Dernier modèle demandant les limites de confiance (CLM) avec un seuil alpha de 0.1 (intervalle de confiance à 90%). Désactivation des graphiques ODS à la fin.
Copié !
1PROC LOESS DATA=Melanoma;
2 model Incidences=Year/clm alpha=0.1;
3RUN;
4 
5ods graphics off;
Ce matériel est fourni "tel quel" par We Are Cas. Il n'y a aucune garantie, expresse ou implicite, quant à la qualité marchande ou à l'adéquation à un usage particulier concernant le matériel ou le code contenu dans les présentes. We Are Cas n'est pas responsable des erreurs dans ce matériel tel qu'il existe maintenant ou existera, et We Are Cas ne fournit pas de support technique pour celui-ci.
Informations de Copyright : SAS SAMPLE LIBRARY


Banner
Le Conseil de l'Expert
Expert
Stéphanie
Spécialiste Machine Learning et IA.
« Face à des données chronologiques présentant des variations locales, comme les taux d'incidence du mélanome, la régression linéaire classique est souvent trop rigide. La procédure LOESS (LOcal regrESSion) est la solution de choix : elle permet de tracer une courbe de tendance flexible qui s'adapte aux données sans imposer de forme mathématique globale (comme une droite ou une parabole). »