Dans les environnements Big Data, le format ORC (Optimized Row Columnar) est devenu un standard pour concilier compression et rapidité d'accès. L'utilisation de l'option DBCREATE_TABLE_OPTS au sein d'une étape DATA SAS permet de piloter directement la structure physique de vos tables dans Hadoop, garantissant une intégration transparente entre votre code SAS et votre écosystème Data Lake.
Type : CREATION_INTERNE
Les données sont définies directement dans le script via une clause `cards;` dans un DATA STEP. Elles sont ensuite utilisées pour créer des tables.
| 1 | |
| 2 | PROC DELETE |
| 3 | DATA=mydblib.seqtab1; |
| 4 | |
| 5 | RUN; |
| 6 | PROC DELETE |
| 7 | DATA=mydblib.compare; |
| 8 | |
| 9 | RUN; |
| 10 |
| 1 | DATA mydblib.compare |
| 2 | work.apd |
| 3 | mydblib.seqtab1 (DBCREATE_TABLE_OPTS="PARTITIONED BY (dealer string) |
| 4 | STORED AS ORC"); |
| 5 | |
| 6 | INPUT car $ color $ dealer $ sales returns dest $; |
| 7 | CARDS; |
| 8 | Toyota Red Smith 10000 100 NC |
| 9 | Toyota Red Smith 15000 110 CT |
| 10 | Chevy Green Smith 17000 45 NJ |
| 11 | Ford Blue Smith 12000 0 CA |
| 12 | Toyota Red Jones 4000 20 NC |
| 13 | Ford Blue Finch 10000 400 NC |
| 14 | Toyota Red Smith 10000 100 NJ |
| 15 | Ford White Smith 15000 110 NC |
| 16 | Ford Blue Smith 12000 0 NJ |
| 17 | Toyota Green Jones 4000 20 NC |
| 18 | Toyota Black Jones 4000 20 FL |
| 19 | Toyota Red Jones 4000 20 NC |
| 20 | Ford Blue Finch 10000 400 AL |
| 21 | Chevy White Finch 10000 400 SC |
| 22 | Ford Black Finch 10000 400 SC |
| 23 | Chrysler Blue Finch 20000 400 NC |
| 24 | Chrysler Green Finch 20000 400 CT |
| 25 | Toyota Green Jones 10000 100 NC |
| 26 | Toyota Red Finch 15000 110 CT |
| 27 | Ford Green Smith 17000 45 NJ |
| 28 | ; |
| 29 | RUN; |
| 1 | title1 ' |
| 2 | PROC PRINT OF DBLIB.SEQTAB1'; |
| 3 | PROC PRINT |
| 4 | DATA=mydblib.seqtab1; |
| 5 | |
| 6 | RUN; |
| 7 |
| 1 | title1 ' |
| 2 | PROC PRINT OF DBLIB.COMPARE'; |
| 3 | PROC PRINT |
| 4 | DATA=mydblib.compare; |
| 5 | |
| 6 | RUN; |
| 7 |