第二章 数据的输入、输出和整理
数据是统计分析的材料和对象,统计分析总是以数据的收集和整理为起点,又以各种数据的形式输出分析报告为终点。本章介绍了SAS数据库和SAS数据集的概念。介绍了如何用菜单方式建立、选用SAS数据库和数据集,以及对数据集进行合并与拆分,将SAS数据集与dBASE、Excel、Lotus和文本文件等常见文件类型间相互转换的方法。介绍了使用SAS/VIEWTABLE、SAS/LAB和SAS/ANALYST等模块进行数据的输入、输出和整理的方法。
§2.1 输入数据的方式
§2.1.1 SAS数据库和SAS数据集
事物的任何现象及其信息都是通过数据表示出来的,统计分析的目的就是通过对与研究对象相关的数据进行分析获得关于研究对象的有用结果。这些与研究对象相关的某些方面的数据组织在一起就构成了一个数据集。SAS系统以文件的形式组织和存放数据集,SAS数据集中不仅存放了数据本身,而且还存放了有关数据的类型、样本量等其他信息。
通常一个研究对象可由多个数据集来描述,这些数据集间存在着某些关系,因此应该将它们组织起来存放。这种存放某些相关联数据集及其信息的场所称为数据库。SAS数据库是以文件夹(目录)的形式存放数据库的。也就是说,一个SAS数据库对应于文件系统中的一个文件夹。
SAS数据集是SAS系统处理数据的基本单位,在用SAS系统进行分析之前,必须首先建立或打开相应的数据集。任何一个SAS数据集都必须存放在一个SAS数据库中。SAS系统安装后初始的歉据库有:Maps,Sashelp,sasuse,Work,其中Work是临时数据库,存放在Work数据库里面的数据集在退出SAS系统后将被自动清除。而存放在Maps,Sashelp和Sasuser数据库中的数据集将被**保存,下次启动SAS系统后仍可找开这些数据集继续使用。
……