Note: The following tests were performed on a dataset of 160 million rows, hosted on a modest virtual architecture (5 nodes).
Note : 1. Aggregation (Group By): Low Cardinality
When you need to sum variables based on a few groups (e.g., Installation Type and Product Line), the natural reflex is to use PROC MEANS or PROC SUMMARY. In CAS, the optimized equivalent is the simple.summary action.
A common (and often outdated) criticism suggests that in-memory engines struggle when the number of groups explodes. Let's verify this by increasing the complexity.
The leap to CAS requires a learning effort, particularly to master the CASL language and CAS Actions. However, for anyone dealing with large volumes of data (Big Data), the return on investment in terms of processing time is immediate and spectacular.
Wichtiger Haftungsausschluss
Die auf WeAreCAS.eu bereitgestellten Codes und Beispiele dienen Lehrzwecken. Es ist zwingend erforderlich, sie nicht blind in Ihre Produktionsumgebungen zu kopieren. Der beste Ansatz besteht darin, die Logik zu verstehen, bevor sie angewendet wird. Wir empfehlen dringend, diese Skripte in einer Testumgebung (Sandbox/Dev) zu testen. WeAreCAS übernimmt keine Verantwortung für mögliche Auswirkungen oder Datenverluste auf Ihren Systemen.
SAS und alle anderen Produkt- oder Dienstleistungsnamen von SAS Institute Inc. sind eingetragene Marken oder Marken von SAS Institute Inc. in den USA und anderen Ländern. ® zeigt die Registrierung in den USA an. WeAreCAS ist eine unabhängige Community-Site und nicht mit SAS Institute Inc. verbunden.
Diese Website verwendet technische und analytische Cookies, um Ihre Erfahrung zu verbessern.
Mehr erfahren.