相关性分析处理变量之间的关系。 相关系数是两个变量之间的线性关联的度量。相关系数的值总是在-1和+1之间。 SAS提供过程PROC CORR以找到数据集中的一对变量之间的相关系数。
在SAS中应用PROC CORR的基本语法是:
PROC CORR DATA = dataset options;
VAR variable;
以下是使用的参数的描述:
数据集中可用的一对变量之间的相关系数可以通过在VAR语句中使用它们的名称来获得。 在下面的例子中,我们使用数据集CARS1并得到显示马力和重量之间的相关系数的结果。
PROC SQL;
create table CARS1 as
SELECT invoice,horsepower,length,weight
FROM
SASHELP.CARS
WHERE make in ('Audi','BMW')
;
RUN;
proc corr data=cars1 ;
VAR horsepower weight ;
BY make;
run;
当执行上面的代码中,我们得到以下结果:
通过简单地应用具有数据集名称的过程,可以获得数据集中可用的所有变量之间的相关系数。
在下面的例子中,我们使用数据集CARS1并获得显示每对变量之间的相关系数的结果。
proc corr data=cars1 ;
run;
当执行上面的代码中,我们得到以下结果:
我们可以通过在PROC语句中选择绘制矩阵的选项来获得变量之间的散点图矩阵。
在下面的例子中,我们得到马力和重量之间的矩阵。
proc corr data=cars1 plots=matrix ;
VAR horsepower weight ;
run;
当执行上面的代码中,我们得到以下结果: