Ce script illustre une compétence avancée sous SAS : l'utilisation du module IML (Interactive Matrix Language) pour manipuler les données non plus comme des observations, mais comme des objets mathématiques.1. L'abstraction des donnéesContrairement à une étape DATA classique, l'utilisation de TableCreateFromDataSet et tableGetVarData transforme les colonnes du jeu de données Cars en une matrice numérique $X$. Cette conversion est fondamentale : elle permet de passer du traitement de données statistique au calcul d'algèbre linéaire pur.2. La Matrice de CovarianceLa fonction cov(X) génère ici une matrice carrée $(3 \times 3)$ essentielle pour l'analyse multivariée.La diagonale représentera la variance de chaque variable (la dispersion de la puissance, du prix MSRP, et de la facture).Les éléments hors-diagonale indiqueront la direction de la relation linéaire entre les paires (ex: Covariance positive entre HorsePower et MSRP).Note de lisibilité : L'instruction print cov[c = colNames r = colNames] est une bonne pratique cruciale en IML. Sans elle, la sortie serait une matrice brute anonyme ; avec elle, vous obtenez un tableau lisible où chaque coefficient est immédiatement identifiable.
Type : SASHELP
Le script utilise le jeu de données `Cars` de la bibliothèque `Sashelp`, qui est une bibliothèque de données d'exemple fournie par SAS et est disponible par défaut dans l'environnement SAS.
| 1 | PROC IML; |
| 2 | tClass = TableCreateFromDataSet("Sashelp", "Cars"); |
| 3 | colNames = {"HorsePower" "MSRP" "Invoice"}; |
| 4 | X = tableGetVarData(tClass, colNames); |
| 5 | cov = cov(X); |
| 6 | PRINT cov[c = colNames r = colNames]; |
| 7 | RUN; |