Dans les études longitudinales, notamment dans le domaine médical ou marketing, il est fréquent de devoir analyser l'évolution d'une variable (comme l'IMC, le chiffre d'affaires, ou un score de risque) par rapport à un événement pivot (une chirurgie, une campagne marketing, une souscription).

Contrairement à une simple comparaison "date à date", la difficulté réside ici dans le fait que la date de référence (l'événement) est spécifique à chaque individu et se trouve elle-même enfouie dans les données.

Cet article explique comment extraire et comparer des données situées à des intervalles précis (par exemple : 6 mois avant et 6 mois après) autour d'un événement cible.

Le Scénario

Prenons l'exemple de patients suivis pour leur IMC (BMI). Nous avons plusieurs relevés par patient. L'un de ces relevés correspond à une chirurgie (surgery = 1). L'objectif est d'identifier les mesures prises 6 mois avant et 6 mois après cette chirurgie pour évaluer l'impact de l'opération.

Les données brutes

Les données comportent un identifiant, une date de visite, un indicateur de chirurgie (0 = non, 1 = oui) et la mesure de l'IMC.

Note importante : Assurez-vous toujours que vos dates sont importées comme des variables numériques (format date) et non comme du texte, pour permettre les calculs arithmétiques.

1	DATA diff_date;
2	INPUT Date_Visit : mmddyy10. ID surgery BMI;
3	FORMAT Date_Visit mmddyy10.;
4	CARDS;
5	07/02/2002 1 0 40
6	11/14/2002 1 0 35
7	05/15/2003 1 1 35 /* Date de chirurgie pour ID 1 */
8	11/04/2003 1 0 25
9	05/04/2004 2 0 50
10	11/10/2004 2 0 53
11	05/03/2005 2 1 45 /* Date de chirurgie pour ID 2 */
12	05/03/2006 2 0 32
13	05/03/2007 2 0 25
14	;
15	RUN;

Le Problème de Logique

Pour filtrer les lignes situées à "t - 6 mois" ou "t + 6 mois", SAS^© doit connaître la date "t" (la chirurgie) lorsqu'il lit n'importe quelle autre ligne du même patient. Or, lors d'une lecture séquentielle classique, SAS^© ne "connaît" que la ligne en cours.

La Solution : Le "Self-Merge" (Auto-jointure)

La méthode la plus efficace consiste à fusionner la table avec elle-même.

Table A (Base) : Contient tout l'historique du patient.
Table B (Référence) : Est filtrée pour ne contenir que la ligne de l'événement (chirurgie).

En fusionnant A et B par identifiant (ID), nous allons "diffuser" la date de chirurgie sur toutes les lignes du patient. Chaque observation aura alors sa propre date (Date_Visit) et la date de référence (_Date_Ref) sur la même ligne, rendant la comparaison triviale.

Le Code SAS^©

Voici comment implémenter cette logique en une seule étape DATA :

1	DATA want;
2	/* On fusionne la table complète avec une version filtrée d'elle-même */
3	MERGE diff_date
4	diff_date(keep=id date_visit surgery
5	rename=(date_visit=_Date_Ref surgery=_surgery_flag)
6	where=(_surgery_flag=1));
7	BY id;
8
9	/* Calcul de la fenêtre temporelle */
10	/* On cherche les dates hors de la fenêtre 'Chirurgie +/- 6 mois' ou l'inverse selon le besoin */
11
12	/* Exemple : Identifier les visites proches de -6 mois ou +6 mois */
13	Months_Diff = intck('month', _Date_Ref, Date_Visit);
14
15	/* Optionnel : Filtrer pour ne garder que les visites d'intérêt */
16	/* Ici, on garde ce qui est entre 5 et 7 mois avant ou après */
17	IF (Months_Diff between -7 and -5) or (Months_Diff between 5 and 7) or (_surgery_flag=1);
18	RUN;

Explication technique détaillée

rename=(date_visit=_Date_Ref ...) : Dans la seconde mention de la table diff_date, nous renommons la date de visite. Cela évite que la fusion n'écrase la date originale. _Date_Ref deviendra une nouvelle colonne contenant la date de chirurgie, répétée sur chaque ligne du patient.
where=(_surgery_flag=1) : Ce filtre est appliqué à la seconde table avant la fusion. Pour chaque ID, SAS^© ne retient que la ligne de la chirurgie. Lors du MERGE, cette ligne unique est jointe à toutes les lignes de l'historique de cet ID (relation One-to-Many).
intck('month', ...) ou intnx(...) : Une fois que nous avons les deux dates sur la même ligne, nous pouvons utiliser :
- INTCK pour compter le nombre d'intervalles (mois) entre les deux dates.
- INTNX pour calculer une date cible théorique (ex: _Date_Ref + 6 mois) et la comparer à la date réelle.

Variante : Filtrage strict avec INTNX

Si votre objectif est de vérifier si une date tombe exactement (ou strictement) avant ou après une fenêtre de 6 mois, vous pouvez utiliser la fonction INTNX directement dans une condition IF.

L'exemple ci-dessous illustre comment exclure la période "neutre" et ne garder que les données lointaines (plus de 6 mois d'écart) :

1	/* Garder uniquement les données situées au-delà de 6 mois d'écart (avant ou après) */
2	IF date_visit < intnx('month', _Date_Ref, -6, 's')
3	or date_visit > intnx('month', _Date_Ref, 6, 's');
4

L'argument 's' (same) dans INTNX assure que si la chirurgie est le 15 du mois, le calcul se basera sur le 15 des mois précédents/suivants.

L'auto-jointure (Self-Merge) est une technique puissante dans SAS^© pour les analyses relationnelles intra-sujet. Elle évite l'utilisation complexe de boucles ou de retenues de variables (RETAIN) et permet de traiter massivement des comparaisons de dates relatives.

Ce qu'il faut retenir :

Utilisez MERGE data data(...) pour rapporter une information unique (date d'événement) sur l'ensemble de l'historique d'un sujet.
Renommez toujours les variables de la table de référence pour éviter les écrasements.
Utilisez INTCK ou INTNX pour gérer proprement la logique calendaire.

Important Disclaimer

The codes and examples provided on WeAreCAS.eu are for educational purposes. It is imperative not to blindly copy-paste them into your production environments. The best approach is to understand the logic before applying it. We strongly recommend testing these scripts in a test environment (Sandbox/Dev). WeAreCAS accepts no responsibility for any impact or data loss on your systems.

Back to article list

Analyser l'évolution avant-après un événement clé

Difficulty Level

Published on : 22/07/2019

Expert Advice

Le Scénario

Les données brutes

Le Problème de Logique

La Solution : Le "Self-Merge" (Auto-jointure)

Le Code SAS^©

Explication technique détaillée

Variante : Filtrage strict avec INTNX

Important Disclaimer

Difficulty Level

Published on : 22/07/2019

Expert Advice

Le Scénario

Les données brutes

Le Problème de Logique

La Solution : Le "Self-Merge" (Auto-jointure)

Le Code SAS©

Explication technique détaillée

Variante : Filtrage strict avec INTNX

Important Disclaimer

Le Code SAS^©