El script implementa un modelo de punto de cambio para identificar un cambio estructural en la relación entre dos variables. Comienza creando un conjunto de datos interno, luego utiliza PROC MCMC para estimar los parámetros de un modelo lineal por partes, incluida la posición del punto de cambio 'cp'. Los resultados de la estimación (medias a posteriori) se almacenan posteriormente en macrovariables a través de un paso DATA _NULL_. Finalmente, PROC SGPLOT se utiliza dos veces: una primera vez para visualizar los datos brutos, y una segunda vez para superponer los datos, las líneas de regresión estimadas a ambos lados del punto de cambio, y la densidad a posteriori de la ubicación de este punto.
Análisis de datos
Type : CREATION_INTERNE
Los datos se generan completamente dentro del script utilizando un paso DATA con una instrucción DATALINES. No se necesitan datos externos.
1 Bloque de código
DATA STEP Data
Explicación : Este bloque crea el conjunto de datos 'stagnant' a partir de datos internos (datalines). La opción ' @@' en la instrucción INPUT permite leer varias observaciones en la misma línea de datos.
INPUT y x @code_sas_json/8_SAS_Intro_ReadFile_MultiCol_@@.json;
4
ind = _n_;
5
DATALINES;
6
1.12 -1.391.12 -1.390.99 -1.081.03 -1.08
7
0.92 -0.940.90 -0.800.81 -0.630.83 -0.63
8
0.65 -0.250.67 -0.250.60 -0.120.59 -0.12
9
0.510.010.440.110.430.110.430.11
10
0.330.250.300.250.250.340.240.34
11
0.130.44 -0.010.59 -0.130.70 -0.140.70
12
-0.300.85 -0.330.85 -0.460.99 -0.430.99
13
-0.651.19
14
;
15
RUN;
2 Bloque de código
PROC SGPLOT
Explicación : Visualización inicial de los datos brutos en forma de nube de puntos para inspeccionar la relación entre x e y.
¡Copiado!
proc sgplot data=stagnant;
scatter x=x y=y;
run;
1
2
PROC SGPLOT
3
DATA=stagnant;
4
scatter x=x y=y;
5
RUN;
6
3 Bloque de código
PROC MCMC
Explicación : Núcleo del análisis. Se utiliza PROC MCMC para ajustar un modelo bayesiano. El código define los parámetros (alpha, cp, beta1, beta2, s2), sus distribuciones a priori, y el modelo lineal que estipula que la pendiente (beta) cambia en función de la posición de x con respecto al punto de cambio 'cp'. El procedimiento genera muestras de la distribución a posteriori de los parámetros.
Explicación : Este paso DATA de tipo _NULL_ (no crea una tabla) lee las medias a posteriori calculadas por PROC MCMC (almacenadas en la tabla 'ds') y las asigna a macrovariables (ej: &cp, &beta1, &beta2) para su uso posterior.
¡Copiado!
data _null_;
set ds;
call symputx(parameter, mean);
run;
1
DATA _null_;
2
SET ds;
3
call symputx(parameter, mean);
4
RUN;
5 Bloque de código
DATA STEP Data
Explicación : Crea un conjunto de datos 'b' para trazar las líneas de regresión del modelo ajustado. Utiliza las macrovariables (&cp, &alpha, &beta1, &beta2) para calcular los valores predichos de y1.
¡Copiado!
data b;
missing A;
input x1 @code_sas_json/8_SAS_Intro_ReadFile_MultiCol_@@.json;
if x1 eq .A then x1 = &cp;
if _n_ <= 2 then y1 = &alpha + &beta1 * (x1 - &cp);
else y1 = &alpha + &beta2 * (x1 - &cp);
datalines;
-1.5 A 1.2
;
run;
Explicación : Utiliza el procedimiento KDE (Kernel Density Estimation) sobre la salida de MCMC para estimar la distribución de probabilidad a posteriori del parámetro 'cp' (el punto de cambio).
¡Copiado!
proc kde data=postout;
univar cp / out=m1 (drop=count);
run;
1
2
PROC KDE
3
DATA=postout;
4
univar cp / out=m1 (drop=count);
5
RUN;
6
7 Bloque de código
DATA STEP Data
Explicación : Este bloque ajusta (escala y desplaza) el valor de la densidad calculada por PROC KDE para que pueda superponerse de manera legible en el gráfico final.
¡Copiado!
data m1;
set m1;
density = (density / 25) - 0.653;
run;
1
DATA m1;
2
SET m1;
3
density = (density / 25) - 0.653;
4
RUN;
8 Bloque de código
DATA STEP Data
Explicación : Combina los datos originales ('stagnant'), las líneas del modelo ajustado ('b') y los datos de densidad del punto de cambio ('m1') en un único conjunto de datos para el gráfico final.
¡Copiado!
data all;
set stagnant b m1;
run;
1
DATA all;
2
SET stagnant b m1;
3
RUN;
9 Bloque de código
PROC SGPLOT
Explicación : Genera el gráfico final completo que superpone: la nube de puntos original, los dos segmentos de recta del modelo de punto de cambio, y la curva de densidad de la distribución a posteriori del parámetro 'cp'.
series x=value y=density / lineattrs = graphdata1;
5
RUN;
Este material se proporciona "tal cual" por We Are Cas. No hay garantías, expresas o implícitas, en cuanto a la comerciabilidad o idoneidad para un propósito particular con respecto a los materiales o el código contenidos en este documento. We Are Cas no es responsable de los errores en este material tal como existe ahora o existirá, ni We Are Cas proporciona soporte técnico para el mismo.
Información de copyright : S A S S A M P L E L I B R A R Y
SAS y todos los demás nombres de productos o servicios de SAS Institute Inc. son marcas registradas o marcas comerciales de SAS Institute Inc. en los EE. UU. y otros países. ® indica registro en los EE. UU. WeAreCAS es un sitio comunitario independiente y no está afiliado a SAS Institute Inc.
Este sitio utiliza cookies técnicas y analíticas para mejorar su experiencia.
Saber más.