Veröffentlicht am :
Datenqualität CREATION_INTERNE

Alphanumerische Inhaltsvalidierung mit VERIFY

Dieser Code ist auch verfügbar auf: English Español Français
Wartet auf Validierung
Dieses Skript veranschaulicht die Verwendung der SAS©-Funktion `VERIFY` zur Datenqualitätskontrolle. Es erstellt einen Testdatensatz und trennt dann die Datensätze in zwei separate Tabellen: eine enthält rein alphanumerische Zeichenfolgen (a-z, A-Z, 0-9) und die andere Zeichenfolgen mit nicht zugelassenen Zeichen (Leerzeichen, Symbole usw.).
Datenanalyse

Type : CREATION_INTERNE


Die Daten werden statisch im Code über eine DATALINES-Anweisung generiert.

1 Codeblock
DATA STEP Data
Erklärung :
Erstellung eines temporären Datensatzes `GOOD_BAD`, der eine Liste verschiedener Zeichenketten für den Test enthält.
Kopiert!
1DATA GOOD_BAD;
2INPUT STRING $40.;
3DATALINES;
41324AcB876acccCCC
5123 456
6aabbccAABBCC123123
7abcde12345
8invalid
9;
2 Codeblock
DATA STEP Data
Erklärung :
Lesen der Quelltabelle und Aufteilung in zwei Zieldatentabellen (`valid`, `invalid`). Die Funktion `VERIFY` wird verwendet, um alle Zeichen zu erkennen, die nicht zur angegebenen alphanumerischen Liste gehören.
Kopiert!
1DATA valid invalid;
2 SET good_bad;
3 IF verify(trim(string), "ABCabc0123456789") = 0 THEN OUTPUT valid;
4 ELSE OUTPUT invalid;
5RUN;
3 Codeblock
PROC PRINT
Erklärung :
Anzeige des Berichts über validierte Zeichenketten.
Kopiert!
1PROC PRINT DATA=valid;
2RUN;
4 Codeblock
PROC PRINT
Erklärung :
Anzeige des Berichts über abgelehnte Zeichenketten.
Kopiert!
1PROC PRINT DATA=invalid;
2RUN;
Dieses Material wird von We Are Cas "wie besehen" zur Verfügung gestellt. Es gibt keine ausdrücklichen oder stillschweigenden Garantien hinsichtlich der Marktgängigkeit oder Eignung für einen bestimmten Zweck in Bezug auf die hierin enthaltenen Materialien oder Codes. We Are Cas ist nicht verantwortlich für Fehler in diesem Material, wie es jetzt existiert oder existieren wird, noch bietet We Are Cas technischen Support dafür an.