Publié le :
ETL CREATION_INTERNE

Création d'un grand ensemble de données synthétiques

Ce code est également disponible en : Deutsch English Español
En attente de validation
Le script utilise un DATA STEP pour créer l'ensemble de données `myLib.biggerDataset`. Une boucle DO est employée pour itérer sur une plage étendue de valeurs. La variable `i` est initialisée avec une valeur manquante, puis itère de -1 000 000 à 1 000 000. Pour chaque itération, la variable `j` est créée en convertissant la valeur numérique de `i` en une chaîne de caractères en utilisant la fonction PUT et le format `fmtNum.`. La variable `k` est assignée une valeur numérique pseudo-aléatoire uniformément distribuée générée par la fonction `RANUNI(17)`. Chaque itération écrit une nouvelle observation dans l'ensemble de données.
Analyse des données

Type : CREATION_INTERNE


L'ensemble de données `myLib.biggerDataset` est entièrement créé de manière interne au script via un DATA STEP. Les valeurs pour les variables `i`, `j` et `k` sont générées par une boucle DO, la fonction PUT pour la conversion de format, et la fonction RANUNI pour la génération de nombres aléatoires.

1 Bloc de code
DATA STEP Data
Explication :
Ce DATA STEP initie la création de l'ensemble de données `myLib.biggerDataset`. La boucle `DO i = ., -1e6 to 1e6` génère des valeurs pour `i` allant de 'manquant' à -1 000 000 jusqu'à 1 000 000. `j` est une version caractère de `i`, et `k` est un nombre aléatoire. `OUTPUT` écrit chaque observation.
Copié !
1DATA myLib.biggerDataset;
2 DO i = ., -1e6 to 1e6;
3 j = put(i, fmtNum.);
4 k = ranuni(17);
5 OUTPUT;
6 END;
7RUN;
Ce matériel est fourni "tel quel" par We Are Cas. Il n'y a aucune garantie, expresse ou implicite, quant à la qualité marchande ou à l'adéquation à un usage particulier concernant le matériel ou le code contenu dans les présentes. We Are Cas n'est pas responsable des erreurs dans ce matériel tel qu'il existe maintenant ou existera, et We Are Cas ne fournit pas de support technique pour celui-ci.