将SAS编程首先需要创建/读取数据集到存储器,然后做该数据的分析。我们需要了解在其中一个程序被写入实现这一目标的流程。
下图显示了按给定顺序写入以创建SAS程序的步骤。
每个SAS程序必须具有所有这些步骤才能完成读取输入数据,分析数据和给出分析输出。 此外,每个步骤结束时的RUN语句都需要完成该步骤的执行。
此步骤涉及将所需数据集加载到SAS存储器中并识别数据集的变量(也称为列)。 它还捕获记录(也称为观察或主体)。 DATA语句的语法如下。
DATA data_set_name; #Name the data set.
INPUT var1,var2,var3; #Define the variables in this data set.
NEW_VAR; #Create new variables.
LABEL; #Assign labels to variables.
DATALINES; #Enter the data.
RUN;
以下示例显示了命名数据集,定义变量,创建新变量和输入数据的简单情况。 这里字符串变量在结尾有一个$,数字值没有它。
DATA TEMP;
INPUT ID $ NAME $ SALARY DEPARTMENT $;
comm = SALARY*0.25;
LABEL ID = 'Employee ID' comm = 'COMMISION';
DATALINES;
1 Rick 623.3 IT
2 Dan 515.2 Operations
3 Michelle 611 IT
4 Ryan 729 HR
5 Gary 843.25 Finance
6 Nina 578 IT
7 Simon 632.8 Operations
8 Guru 722.5 Finance
;
RUN;
该步骤包括调用的SAS内置程序来分析数据。
PROC procedure_name options; #The name of the proc.
RUN;
以下示例显示使用MEANS过程打印数据集中数值变量的平均值。
PROC MEANS;
RUN;
可以使用条件输出语句显示数据集中的数据。
PROC PRINT DATA = data_set;
OPTIONS;
RUN;
下面的示例显示在输出中使用where子句从数据集中只产生少数记录。
PROC PRINT DATA=TEMP;
WHERE SALARY > 700;
RUN;
下面是每个上述步骤的完整代码。
上面代码的输出在RESULTS选项卡中可见。