Das Hauptziel dieses Skripts ist es, ein tiefgehendes Verständnis einer Produktdatenbank zu vermitteln und relevante Informationen hinzuzufügen. Es beginnt mit der Einrichtung einer Verknüpfung zu einem externen Ordner über eine LIBNAME-Anweisung. Anschließend werden die Struktur und der Inhalt des Datensatzes 'cadastro_produto' überprüft. Deskriptive statistische Analysen (univariate und Kreuztabellenhäufigkeiten) werden für Variablen wie 'gênero', 'plataforma' und 'nome' durchgeführt. Ein DATA STEP wird verwendet, um eine binäre Variable 'lancamento' basierend auf dem Datum zu erstellen, die angibt, ob ein Produkt eine 'Einführung' ist. Schließlich speichert das Skript eine aktualisierte Version des Datensatzes mit dieser neuen, zur besseren Verständlichkeit umbenannten Variable und verbesserten Beschriftungen, um die Interpretation zukünftiger Berichte zu erleichtern.
Datenanalyse
Type : EXTERNE
Das Skript verwendet den Datensatz 'cadastro_produto', der über die Bibliothek 'alura' aus dem Ordner '/folders/myfolders/AluraPlay' geladen wird. Dieser Datensatz wird nicht innerhalb des SAS-Skripts erstellt oder generiert, sondern wird als im angegebenen Pfad vorhanden vorausgesetzt.
1 Codeblock
LIBNAME / PROC DATASETS
Erklärung : Deklariert eine SAS-Bibliothek namens 'alura', die auf den angegebenen Ordnerpfad verweist. Anschließend wird PROC DATASETS verwendet, um detaillierte Informationen über die in dieser Bibliothek enthaltenen Tabellen aufzulisten, um die Existenz der erwarteten Datensätze zu überprüfen.
Kopiert!
/* Declara o atalho para a minha pasta da AluraPlay */
LIBNAME alura "/folders/myfolders/AluraPlay";
* Vou checar o meu diretório da Alura ;
PROC DATASETS
lib=alura details;
RUN;
1
/* Declara o atalho para a minha pasta da AluraPlay */
2
LIBNAME alura "/folders/myfolders/AluraPlay";
3
4
* Vou checar o meu diretório da Alura ;
5
PROC DATASETS
6
lib=alura details;
7
RUN;
2 Codeblock
PROC CONTENTS
Erklärung : Zeigt die Metadaten (Wörterbuch) des Datensatzes 'alura.cadastro_produto' an, einschließlich Variablennamen, deren Typen, Längen, Formate und andere Attribute, um einen Überblick über die Struktur des Quelldatensatzes zu geben.
Kopiert!
* Checa o conteúdo da minha base de cadastro produto ;
PROC CONTENTS
data=alura.cadastro_produto;
RUN;
1
* Checa o conteúdo da minha base de cadastro produto ;
2
PROC CONTENTS
3
DATA=alura.cadastro_produto;
4
RUN;
3 Codeblock
PROC PRINT
Erklärung : Gibt den gesamten Datensatz 'alura.cadastro_produto' in der Standardausgabe aus, was eine schnelle visuelle Überprüfung der ersten Beobachtungen ermöglicht.
Kopiert!
* Imprime a minha base de cadastro produto ;
PROC PRINT
data=alura.cadastro_produto;
RUN;
1
* Imprime a minha base de cadastro produto ;
2
PROC PRINT
3
DATA=alura.cadastro_produto;
4
RUN;
4 Codeblock
PROC FREQ
Erklärung : Generiert univariate Häufigkeitstabellen für die kategorialen Variablen 'genero', 'plataforma' und 'nome' des Datensatzes 'alura.cadastro_produto'. Die Option NLEVELS zeigt die Anzahl der eindeutigen Stufen für jede Variable an, was für die Datenexploration nützlich ist.
Kopiert!
* Gera as frquencias das variáveis Gênero, Plataforma e Nome ;
PROC FREQ
data=alura.cadastro_produto nlevels;
table genero plataforma nome;
RUN;
1
* Gera as frquencias das variáveis Gênero, Plataforma e Nome ;
2
PROC FREQ
3
DATA=alura.cadastro_produto nlevels;
4
TABLE genero plataforma nome;
5
RUN;
5 Codeblock
DATA STEP Data
Erklärung : Erstellt einen neuen temporären Datensatz namens 'teste' durch Kopieren von 'alura.cadastro_produto'. Eine neue Variable 'lancamento' wird erstellt: Sie nimmt den Wert 1 an, wenn die Variable 'data' größer als '201606' ist (was eine kürzliche Einführung anzeigt), und 0 sonst. Dies wandelt ein Datum in einen binären Indikator um.
Kopiert!
/* Cria uma nova base com a variável de flag de lançamento */
DATA teste;
set alura.cadastro_produto;
IF data > 201606
THEN lancamento = 1;
ELSE lancamento = 0;
RUN;
1
/* Cria uma nova base com a variável de flag de lançamento */
2
DATA teste;
3
SET alura.cadastro_produto;
4
5
IFDATA > 201606
6
THEN lancamento = 1;
7
ELSE lancamento = 0;
8
9
RUN;
6 Codeblock
PROC PRINT
Erklärung : Gibt den Inhalt des Datensatzes 'teste' aus, um die korrekte Erstellung der Variablen 'lancamento' visuell zu überprüfen.
Kopiert!
* Imprime minha nova base ;
PROC PRINT
data=teste;
RUN;
1
* Imprime minha nova base ;
2
PROC PRINT
3
DATA=teste;
4
RUN;
7 Codeblock
PROC FREQ
Erklärung : Generiert eine Häufigkeitstabelle für die neue Variable 'lancamento' im Datensatz 'teste', die die Verteilung der als 'Einführungen' betrachteten Produkte im Vergleich zu anderen zeigt.
Kopiert!
* Gera a tabela de frequência da minha variável de laçamento ;
PROC FREQ
data=teste;
table lancamento;
RUN;
1
* Gera a tabela de frequência da minha variável de laçamento ;
2
PROC FREQ
3
DATA=teste;
4
TABLE lancamento;
5
RUN;
8 Codeblock
PROC FREQ
Erklärung : Generiert eine Kreuztabelle zwischen 'genero' und 'lancamento' aus dem Datensatz 'teste'. Die Optionen NOROW, NOCOL und NOPERCENT unterdrücken Zeilen-, Spalten- und Gesamtprozentsätze und zeigen nur die Häufigkeiten für eine gezielte Analyse an.
Kopiert!
* Gera a frequencia cruzada das variáveis Gênero e Lançamento ;
PROC FREQ
data=teste;
table genero*lancamento
/norow nocol nopercent;
RUN;
1
* Gera a frequencia cruzada das variáveis Gênero e Lançamento ;
2
PROC FREQ
3
DATA=teste;
4
TABLE genero*lancamento
5
/norow nocol nopercent;
6
RUN;
9 Codeblock
PROC FREQ
Erklärung : Generiert eine Kreuztabelle zwischen 'nome' und 'genero' aus dem ursprünglichen Datensatz 'alura.cadastro_produto'. Die Option LIST zeigt die Kontingenztafel in Listenform an, was bei Kombinationen mit vielen Stufen nützlich ist. NLEVELS zeigt die Anzahl der eindeutigen Stufen für jede Variable an.
Kopiert!
* Gera a lista cruzada das variáveis Nome e Gênero ;
PROC FREQ
data=alura.cadastro_produto nlevels;
*table nome;
table nome*genero
/ list;
RUN;
1
* Gera a lista cruzada das variáveis Nome e Gênero ;
2
PROC FREQ
3
DATA=alura.cadastro_produto nlevels;
4
*table nome;
5
TABLE nome*genero
6
/ list;
7
RUN;
10 Codeblock
DATA STEP Data
Erklärung : Erstellt den finalen Datensatz 'alura.cadastro_produto_v2' durch Kopieren von 'teste'. Die Variable 'lancamento' wird zur besseren Klarheit in 'flag_lancamento' umbenannt. Beschriftungen (Labels) werden den Variablen 'Genero' und 'lancamento' zugewiesen, um die Datendokumentation zu erweitern und die Lesbarkeit der Berichtsoutputs zu verbessern.
Kopiert!
/* Salva a minha base intermendiária no diretório da AluraPlay */
DATA alura.cadastro_produto_v2;
set teste;
rename lancamento = flag_lancamento;
label Genero = "Gênero"
lancamento = "Marque 1 pour les jeux qui sont un lancement et 0 sinon";
RUN;
1
/* Salva a minha base intermendiária no diretório da AluraPlay */
2
DATA alura.cadastro_produto_v2;
3
SET teste;
4
rename lancamento = flag_lancamento;
5
label Genero = "Gênero"
6
lancamento = "Marque 1 pour les jeux qui sont un lancement et 0 sinon";
7
RUN;
11 Codeblock
PROC CONTENTS
Erklärung : Überprüft die Metadaten des finalen Datensatzes 'alura.cadastro_produto_v2', um zu bestätigen, dass alle Änderungen (Variablenumbenennung, Anwenden von Beschriftungen) korrekt durchgeführt wurden.
Kopiert!
* Checar se minha base 'cadastro_produto_v2' foi criada corretamente ;
PROC CONTENTS
data=alura.cadastro_produto_v2;
RUN;
1
* Checar se minha base 'cadastro_produto_v2' foi criada corretamente ;
2
PROC CONTENTS
3
DATA=alura.cadastro_produto_v2;
4
RUN;
Dieses Material wird von We Are Cas "wie besehen" zur Verfügung gestellt. Es gibt keine ausdrücklichen oder stillschweigenden Garantien hinsichtlich der Marktgängigkeit oder Eignung für einen bestimmten Zweck in Bezug auf die hierin enthaltenen Materialien oder Codes. We Are Cas ist nicht verantwortlich für Fehler in diesem Material, wie es jetzt existiert oder existieren wird, noch bietet We Are Cas technischen Support dafür an.
SAS und alle anderen Produkt- oder Dienstleistungsnamen von SAS Institute Inc. sind eingetragene Marken oder Marken von SAS Institute Inc. in den USA und anderen Ländern. ® zeigt die Registrierung in den USA an. WeAreCAS ist eine unabhängige Community-Site und nicht mit SAS Institute Inc. verbunden.
Diese Website verwendet technische und analytische Cookies, um Ihre Erfahrung zu verbessern.
Mehr erfahren.