- Stata统计分析与行业应用案例详解(第2版)
- 张甜
- 920字
- 2024-11-01 16:04:51
1.6 定义数据的子集
1.6.1 定义数据的子集概述
在很多情况下,现有的Stata数据达不到分析要求,我们需要截取出数据的一部分进行分析,或者删除不需要进入分析范围的数据,这时我们就需要用到Stata的定义数据子集功能。在本节中,我们将通过实例的方式讲述定义数据子集的基本操作。
1.6.2 相关数据来源
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0032_0001.jpg?sign=1739000238-bcHB9LXCrGFBaYqexAehsgmcsnv2uaFJ-0-c83b2bfc015db65284195fc1cb798f8b)
【例1.5】试通过操作案例1.5.dta完成以下工作。
(1)列出第3条数据。
(2)列出第1~3条数据。
(3)列出变量值“shangjiao”最小的两条数据。
(4)列出变量值“year”大于2005的数据。
(5)列出变量值“year”大于2007且变量值“shangjiao”大于865的数据。
(6)删除第3条数据。
(7)删除变量值“year”等于2005的数据。
(8)删除变量值“year”大于2005且变量值“shangjiao”大于865的数据。
1.6.3 Stata分析过程
分析步骤如下:
进入Stata 14.0,打开相关数据文件,弹出如图1.30所示的主界面。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0032_0003.jpg?sign=1739000238-vycEUlWhiAD9ONNxll7DK3CU5nSjH4Nh-0-7bcebc9652926769f4cb0f7793264c8e)
图1.30 主界面
在主界面的“Command”文本框中输入操作命令并按键盘上的回车键进行确认。对应的命令如下。
●list in 3:本命令的含义是列出第3条数据。
●list in 1/3:本命令的含义是列出第1~3条数据。
●sort shangjiao list year shangjiao shenjiao in 1/2:本命令的含义是列出变量值“shangjiao”最小的两条数据。
●list if year>2005:本命令的含义是列出变量值“year”大于2005的数据。
●list if year>2007 & shangjiao>865:本命令的含义是列出变量值“year”大于2007且变量值“shangjiao”大于865的数据。
●drop in 3:本命令的含义是删除第3条数据。
●drop if year==2005:本命令的含义是删除变量值“year”等于2005的数据。
●drop if year>2005 & shangjiao>865:本命令的含义是删除变量值“year”大于2005且变量值“shangjiao”大于865的数据。
1.6.4 结果分析
图1.31是列出第3条数据的结果。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0033_0001.jpg?sign=1739000238-fYYAMXv6ngFyQOvt6phT7LhQdRYU2khK-0-d8d2bcd141675e0e0b5eb557069f85c5)
图1.31 分析结果1
图1.32是列出第1~3条数据的结果。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0033_0002.jpg?sign=1739000238-jO9f3Pdt2NWullswt5UeehfwvReqwlM7-0-dac738181fa4d3804741aa9e33540ea1)
图1.32 分析结果2
图1.33是列出变量值“shangjiao”最小的两条数据结果。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0033_0003.jpg?sign=1739000238-Hn5vHwjniwfqt3N0UwGpuvmVNC5SPgS9-0-5ca6ab3e53a2a1420df94d994dcf8755)
图1.33 分析结果3
图1.34是列出变量值“year”大于2005的数据结果。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0033_0004.jpg?sign=1739000238-u3Fu0Tt6gSwRuCyDU5TvqqGgPlnfGLEY-0-b717d108caf0055eb53d497dd645648c)
图1.34 分析结果4
图1.35是列出变量值“year”大于2007且变量值“shangjiao”大于865的数据结果。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0033_0005.jpg?sign=1739000238-nsprLkuNo9QoUcCbfDEDwTZbcA76O0zQ-0-7a0993c529d81cee07250859a85a5c36)
图1.35 分析结果5
图1.36是删除第3条数据的结果。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0033_0006.jpg?sign=1739000238-wEkejVqg4Iqefs0RWLJZuerGeWzlbWZd-0-d32b25899a690221ac7cd717d289c41c)
图1.36 分析结果6
图1.37是删除变量值“year”等于2005的数据结果。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0034_0001.jpg?sign=1739000238-PFWxFeETomJpzqBQlaXVgjLvICs88pUN-0-abaca3b68eed74529a0ba74774d06238)
图1.37 分析结果7
图1.38是删除变量值“year”大于2005且变量值“shangjiao”大于865的数据结果。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0034_0002.jpg?sign=1739000238-wFy5VGjSUACOZ3jlA1X2mOZLppYL5uKu-0-7dae01bce3500b7cf746670902514040)
图1.38 分析结果8
1.6.5 案例延伸
我们在上述的Stata命令中用到了Stata中的关系运算符和逻辑运算符。Stata 14.0中共支持6种关系运算符和3种逻辑运算符,如表1.7和表1.8所示。
表1.7 关系运算符
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0034_0003.jpg?sign=1739000238-OA60Hx6XWXPNde89283I6t4sfma1ngmj-0-9ddbeb93f8d6c2fd711114a042af0df4)
表1.8 逻辑运算符
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0034_0004.jpg?sign=1739000238-e2HwenWeNgyrJYSRYkkJhvWA8x4R9yWr-0-6d79b275fb3bd7345850b78f96dbf96b)