2.2 创建/导入数据集

统计分析都是基于数据集的,针对数据集的操作是Stata最基本的操作,下面介绍如何在Stata中创建/导入数据集。

2.2.1 利用数据编辑器创建数据集

在Stata主界面中,通过以下操作可以弹出如图2-4所示的“数据编辑器(编辑)”窗口。

● 执行菜单栏中的“窗口”→“数据编辑器”命令。

● 单击工具栏中的[数据编辑器(编辑)]图标。

● 在命令窗口中执行edit命令。

(1)在“数据编辑器(编辑)”窗口左侧的单元格中可以输入变量值,如1112,此时系统会自动创建变量var1,若继续在下一列中输入1118,则系统会自动创建变量var2,如图2-5所示,依次类推,即可根据需要创建变量。

(2)在“数据编辑器(编辑)”窗口右侧上方的变量窗口中显示刚刚创建的变量的属性,包括名称、标签、类型、格式、值标签等。

图2-4 “数据编辑器(编辑)”窗口

图2-5 创建变量

(3)在“数据编辑器(编辑)”窗口右侧下方的属性窗口中可以修改变量的属性,在修改变量的属性前首先需要在变量窗口中选中变量,如将变量名称var1修改为ParameterA。

(4)在“数据编辑器(编辑)”窗口中,执行菜单栏中的“数据”→“数据编辑器”→“数据编辑器(浏览)”命令,可以将数据编辑器切换到浏览状态,此时不能对数据进行编辑。

(5)数据编辑完成后,单击右上角的(关闭)按钮,即可返回Stata主界面。

2.2.2 通过命令输入数据

在Stata的命令窗口中可以直接通过input命令将数据输入内存中的数据集,其命令格式为:

其中,varlist为需要输入的变量名称列表;automatic可以使Stata从遇到的非数值型数据中创建值标签,它会自动加长显示格式以满足最长的标签要求;label允许用户输入标签(字符串),而非与值标签相关联的变量的数值,只有指定自动时才会自动创建新的值标签。

【例2-5】利用input命令创建数据集示例。

(1)创建初始数据集。在命令窗口中依次输入:

通过以上操作创建了acc_rate与spdlimit两个变量,并依次输入观测值,按Enter键接受输入,其中用“.”表示输入缺失值(空值)。在输入end命令后结束数据的输入。

通过list命令查看输入的数据,如图2-6(a)所示。

(2)为已存在的变量增加观测值。在命令窗口中依次输入:

(3)在已存在的数据集中添加变量acc_pts、junk。在命令窗口中依次输入:

通过list命令可以确认输入的数据,如图2-6(b)所示。

图2-6 创建数据集

【例2-6】利用input命令创建字符串数据集示例。

在命令窗口中依次输入:

通过list命令可以确认输入的数据,如图2-7(a)所示,在“数据编辑器”窗口中显示的结果如图2-7(b)所示。

图2-7 创建字符串数据集

2.2.3 读取已有Stata数据

对于已存在的Stata数据文件,可以通过下面的方式打开。

● 直接双击需要打开的数据文件(该文件默认打开方式为Stata)。

● 在Stata主界面中,执行菜单栏中的“文件”→“打开”命令,打开需要的文件。

● 在命令窗口中执行use命令。

在Stata中,多用use命令将之前保存的Stata格式数据集加载到系统中。如果指定的文件名没有后缀,则默认为dta。该命令的调用格式为:

其中,clear指定可以替换系统中的数据;nolabel用于防止加载保存数据中的值标签。

注意

如果文件路径或文件名中包含空格,则需要将其放置在双引号""中。当命令中指定加载的变量名时,必须使用using命令,否则会提示错误。

【例2-7】①加载Stata格式数据集hiway.dta到系统中;②加载Stata格式数据集nlswork.dta的ln_wage、grade、age、tenure、race子集到系统中。

设文件存储在当前目录D:\DingJB\Stata\下的mysubdir文件夹中。

在命令窗口中输入:

执行上述操作后即可将对应的数据集与子集加载到系统中。

说明

当使用use命令加载数据集时,系统中的原有数据集将被自动清除。

2.2.4 导入其他格式数据

在Stata中也可以导入其他格式数据,在Stata主界面中执行菜单栏中的“文件”→“导入”命令,在弹出的菜单中可以看到Stata支持导入的数据格式,如图2-8所示。下面简单介绍Excel电子表格及文本数据的导入方式。

图2-8 Stata支持导入的数据格式

1.导入Excel电子表格

在Stata主界面中执行菜单栏中的“文件”→“导入”→“Excel电子表格”命令,即可弹出“导入Excel文件”对话框,如图2-9所示。在该对话框中找到需要导入的Excel文件。

根据下方的数据预览进行设置,确定是否需要勾选“将第一行作为变量名”“将所有数据导入为字符串类型”复选框。

满足要求后,单击“确定”按钮即可将Excel文件导入Stata。

图2-9 “导入Excel文件”对话框

说明

通常也可以通过打开的Excel文件将数据通过复制、粘贴的方式导入Stata。

2.导入文本数据

在Stata主界面中执行菜单栏中的“文件”→“导入”→“文本数据”命令,即可弹出“导入带分隔符的文本数据”对话框,如图2-10所示。在该对话框中找到需要导入的文本数据文件。

根据下方的数据预览进行设置,确定是否需要勾选“连续分隔符视为一个处理”“根据区域设置解析数字”复选框。

满足要求后,单击“确定”按钮即可将文本数据导入Stata。

图2-10 “导入带分隔符的文本数据”对话框