copula copulaFit

Estimación de Cópula T en Datos Masivos de Siniestralidad

Scénario de test & Cas d'usage

Contexto empresarial

Una aseguradora multinacional desea modelar la dependencia de cola (eventos extremos simultáneos) entre tres líneas de negocio: Automóvil, Hogar y Salud. El conjunto de datos es voluminoso (100k registros). Se requiere una Cópula T (Student) porque permite mayor dependencia en las colas que la Normal, ajustando también los grados de libertad.
Preparación de datos

Generación de 100,000 registros simulando siniestros con dependencias complejas.

¡Copiado!
1DATA mycas.claims_huge;
2 call streaminit(999);
3 DO i = 1 to 100000;
4 factor_comun = rand('T', 4); /* Distribución T con colas pesadas */
5 loss_auto = exp(0.5 * factor_comun + rand('NORMAL'));
6 loss_home = exp(0.4 * factor_comun + rand('NORMAL'));
7 loss_health = exp(0.2 * factor_comun + rand('NORMAL'));
8 OUTPUT;
9 END;
10RUN;

Étapes de réalisation

1
Ajuste de Cópula T con inicialización de grados de libertad (df=4) usando MLE.
¡Copiado!
1PROC CAS;
2 copula.copulaFit /
3 TABLE={name='claims_huge'},
4 var={'loss_auto', 'loss_home', 'loss_health'},
5 copulaType='T',
6 method='MLE',
7 df=4,
8 outpseudo={name='claims_pseudo', replace=true};
9RUN;

Resultado esperado


La acción debe manejar el volumen de 100k registros sin errores de memoria. La salida debe mostrar la estimación de los grados de libertad (cercanos a 4) y la matriz de correlación. Se debe generar la tabla 'claims_pseudo' con los datos transformados al espacio uniforme.