2015年中山大学432统计学[专业硕士]考研真题及详解

一、(每小题3分,共60分)单项选择题

1.在6对夫妻中任选4人,则至少有一对夫妻被选中的概率为(  )。

A.

B.

C.

D.

【解析】从6对夫妻里任选出4人”,总共有种选法;对于事件“没有一对夫妇被选中”,根据乘法原理,先从6对夫妻中选出4对,有种选法,再从选中的4对中的每一对选出1人,有24种选法,因此事件“没有一对夫妇被选中”的概率为。则根据互斥关系,事件“至少有一对夫妻被选中”的概率为。(本题选项设置有误,无正确答案)

2.设A,B,C都是事件。又A和B独立,B和C独立,A和C互不相容。P(A)=1/2,P(B)=1/4,P(C)=1/8,则概率P(A∪B∪C)为(  )。

A.23/33

B.23/32

C.11/16

D.2/3

【答案】B

【解析】由题意,P(AB)=P(A)P(B),P(BC)=P(B)P(C),P(AC)=0,所以,P(A∪B∪C)=P(A)+P(B)+P(C)-P(AB)-P(AC)-P(BC)+P(ABC)=P(A)+P(B)+P(C)-P(A)P(B)-P(B)P(C)=23/32,所以选择B项。

3.将一枚硬币独立地掷两次,引进事件:A1={掷第一次出现正面},A2={掷第二次出现正面},A3={正、反面各出现一次},A4={正面出现两次},则(  )。

A.A1,A2,A3两两独立

B.A1,A2,A3相互独立

C.A2,A3,A4两两独立

D.A2,A3,A4相互独立

【答案】A

【解析】由题意,P(A1)=1/2,P(A2)=1/2,P(A3)=1/2,P(A4)=1/4,所以

P(A1A2)=1/4=P(A1)P(A2)=1/2×1/2

P(A2A3)=1/4=P(A2)P(A3)=1/2×1/2

P(A1A3)=1/4=P(A1)P(A3)=1/2×1/2

所以,A1,A2,A3两两独立。而P(A1A2A3)=0≠P(A1)P(A2)P(A3)=1/8,P(A2A3A4)=0≠P(A2)P(A3)P(A4)=1/16都不满足事件相互独立的条件,故选择A项。

4.随机变量X有密度

则常数c的取值为(  )。

A.2

B.π

C.π/2

D.1/π

【答案】D

【解析】密度函数需满足:

由题意得,

解得,c=1/π。

5.设z在[0,1]上服从均匀分布,随机变量X,Y,满足方程组

则X和Y各自落在[0,1]中的概率为(  )。

A.1/3和1/2

B.1/2和1/2

C.1/3和0

D.1/3和2/3

【答案】C

【解析】由题意,解出X,Y的表示式为:

由于Z在[0,1]上服从均匀分布,所以X服从[0,3]上的均匀分布,Y服从[1,2]上的均匀分布,所以X,Y各自落在[0,1]中的概率分别为1/3,0。

6.设X和Y都服从标准正态分布,则(  )。

A.X+Y服从正态分布

B.X2+Y2服从卡方分布

C.X2和Y2都服从卡方分布

D.X2/Y2服从F分布

【答案】C

【解析】A项,正态分布具有可加性的前提是随机变量X,Y相互独立,题目中未说明X,Y相互独立,所以X+Y不一定服从正态分布;B项,卡方分布要求X,Y相互独立且同分布于标准正态分布,题目中未说明X,Y相互独立;D项,F分布要求X2,Y2是相互独立的卡方分布,题目中未说明X,Y相互独立。

7.当随机向量(X,Y)服从单位圆面D={(x,y):x2+y2≤1}上的均匀分布,则:Y的边际分布F(y)与y关于x的条件分布G(y|x),则(  )。

A.F(y)不服从均匀分布,G(y|x)服从均匀分布

B.F(y)服从均匀分布,G(y|x)不服从均匀分布

C.二者均服从均匀分布

D.二者均不服从均匀分布

【答案】A

【解析】区域D是圆面,面积为π,所以此随机向量的密度函数为f(x,y)=1/π,x,y∈D。所以Y的边际密度为:

Y关于X的条件密度为:

因此Y的边际分布不是均匀分布,而Y关于X的条件分布是的均匀分布,故选A。

8.设随机变量X~t(n),n>1,Y=1/X2,则(  )。

A.Y~χ2(n)

B.Y~χ2(n-1)

C.Y~F(1,n)

D.Y~F(n,1)

【答案】D

【解析】由于随机变量X服从自由度为n的t分布,设

其中,随机变量X1服从N(0,1),X2服从χ2(n),则,

Y服从F(n,1)。

9.设X1,X2,…,Xn(n>1)为来自总体期望为μ,总体方差为σ2的样本,`X为样本均值,则(  )。

A.

B.

C.

D.

【答案】C

【解析】由题意,E(`X)=μ,D(`X)=σ2/n。由于样本X1,X2,…,Xn独立同分布,所以有:

10.设X~N(μ1,σ12),Y~N(μ2,σ22),若P{|X-μ1|<c}<P{|Y-μ2|<c},其中c为某一正数,则(  )。

A.σ12<σ22

B.σ12>σ22

C.μ1<μ2

D.μ1>μ2

【答案】B

【解析】由题意,得

所以得到Φ(c/σ1)<Φ(c/σ2),即c/σ1<c/σ2,所以σ1>σ2>0,即σ12>σ22

11.设EX=0,Var(X)=1,EY=1,Var(Y)=4,且相关系数ρXY=1,则(  )。

A.P(2X-Y+1=0)=1

B.P(2X-Y-1=0)=1

C.P(2X+Y+1=0)=1

D.P(2X+Y-1=0)=1

【答案】A

【解析】由ρXY=1得知,X和Y有严格的线性函数关系,且为正相关关系。设Y=aX+b,a>0,则:

整理得,所以P(2X-Y+1=0)=1。

12.在假设检验中,第一类错误是指(  )。

A.当原假设为真时,接受原假设

B.当原假设为真时,拒绝原假设

C.当备选假设为真时,接受原假设

D.当备选假设为真时,拒绝原假设

【答案】B

【解析】假设检验中所犯的错误有两种类型,第一类错误是原假设为真而拒绝原假设,犯这种错误的概率用α表示,所以也称α错误或弃真错误;第二类错误是原假设为伪而不拒绝原假设,犯这种错误的概率用β表示,所以也称β错误或取伪错误。

13.设X1,X2,…,Xn为来自二项分布B(m,p)的样本,X(_)和分别为样本均值和样本方差,若X(_)+cS2为mp2的无偏估计量,则(  )。

A.c=-2

B.c=-1

C.c=1

D.c=2

【答案】B

【解析】由无偏估计的概念可得,E(X(_)+cS2)=mp2,而X(_),S2分别是总体均值和方差的无偏估计,所以,E(X(_)+cS2)=E(X(_))+cE(S2)=mp=cmp(1-p)=mp2,所以,c=-1。

14.设X1,X2,…,Xn为来自正态分布N(μ,σ2)的样本,其中μ为己知,X(_)为样本均值,则σ2的最大似然估计为(  )。

A.

B.

C.

D.

【答案】C

【解析】似然函数为:

对数似然函数为:

对对数似然函数求导并令其为0得:

解得σ2的极大似然估计为:

15.设总体X的概率密度函数为

X1,X2,…,Xn为来自总体X的样本,则θ的矩估计量为(  )。

A.X(_)

B.X(_)-1

C.X(_)+1

D.1/X(_)

【答案】B

【解析】由题意得:

得到θ的矩估计量为:θ(∧)=X(_)-1。

16.设X1,X2,…,Xn为来自正态分布N(μ,σ2)的样本,其中σ2为己知,X(_)为样本均值。考虑如下假设检验:H0:μ≤μ0 v.s. H1:μ>μ0,标准正态分布的95%分位数为1.645,在显著性水平为0.05下,拒绝H0等价于(  )。

A.单侧区间不包含μ0

B.单侧区间包含μ0

C.单侧区间不包含μ0

D.单侧区间包含μ0

【答案】D

【解析】由题意,这是一个正态总体均值的右单侧检验,采用Z统计量,拒绝域的形式为:Z>Z0.95,即

所以当

拒绝H0,选择D项。

17.设X1,X2,…,Xn独立同分布,具有期望μ,则(  )。

A.exp(X(_))是eμ的相合估计量

B.exp(X(_))是eμ的最大似然估计量

C.exp(X(_))是eμ的无偏估计量

D.exp(X(_))是eμ的充分统计量

【答案】A

【解析】相合估计量是指当样本数n趋于无穷大时,估计量的值趋于待估计的参数。由大数定律,

所以exp(X(_))是eμ的相合估计量。

18.设X1,X2都服从参数为1的指数分布,Y服从参数为2的指数分布,f(y)=2e-2y,0<y<∞,且X1,X2,Y相互独立,则(  )。

A.

B.

C.

D.

【答案】A

【解析】独立同分布的指数分布的和服从伽玛分布,因此X1+X2~Ga(2,1),Y~Ga(1,2),根据伽马分布的性质有

于是

再根据伽玛分布和卡方分布的关系可知,2(X1+X2)~χ2(4),4Y~χ2(2)。由于X1,X2,Y相互独立,因此有

19.设θ(∧)为参数θ的估计量,且θ(∧)的期望与方差σ2均存在,则必有(  )。

A.

B.

C.

D.

【答案】D

【解析】由于Var(θ(∧))=E(θ(∧)-θ)2,根据切比雪夫不等式可知D项正确。

20.设θ(∧)n为参数θ的估计量,且θ(∧)n的期望与方差均存在,当样本量n→∞时,E(θ(∧)n)→θ,var(θ(∧)n)→0,则以下说法错误的是(  )。

A.θ(∧)n是θ的相合估计量

B.θ(∧)n依分布收敛到θ

C.

D.

【答案】C

【解析】根据相合估计的判定方法可知A正确;根据相合估计的定义可知D正确;由于θ(∧)n是θ的相合估计,因此θ(∧)n依概率收敛于θ,而依概率收敛强于依分布收敛,因此B正确;而C项是殆必收敛,强于依概率收敛,不能由依概率收敛推出,因此C项错误。

二、(共30分)设一个系统由甲乙两种类型的元件串联而成,两个元件的使用寿命记为X与Y,分别服从参数为λ与μ的指数分布,且相互独立。通常X与Y,不能完全观测到,仅仅可以观测到系统的使用寿命Z与导致系统失效的元件类型W。

Z=min(X,Y)

(1)(6分)求Z的分布。

(2)(8分)证明:Z与W相互独立。

(3)(8分)若(Z1,W1),(Z2,W2),…,(Zn,Wn)为(Z,W)的随机样本,求参数λ与μ的最大似然估计λ(∧),μ(∧)。

(4)(8分)计算E(λ(∧)),并以此说明λ(∧)是否为参数λ的无偏估计。

注:参数为λ的指数分布的密度函数:f(x|λ)=λe-λx,0<x<∞

参数为α,β的Gamma分布Ga(α,β)的密度函数:

解:(1)设Z的分布函数为F(z),则,F(z)=P(Z≤z)=1-P(Z>z)=1-P(X>z,Y>z),由于X,Y相互独立,所以P(X>z,Y>z)=P(X>z)P(Y>z),所以

即Z服从参数为λ+μ的指数分布。

(2)随机变量X与Y相互独立,故(X,Y)的联合分布密度为:

f(x,y)=fX(x)fY(y)=λμe-λx-μy,x>0,y>0

同理P(W=0)=μ/(λ+μ),

因此,Z与W相互独立。

(3)W服从参数为的0-1分布,即,W的分布函数为

由于Z与W相互独立,所以Z与W的联合密度函数为:

求λ,μ的极大似然估计如下:

建立似然函数:

求出对数似然函数:

对数似然函数分别关于λ,μ求偏导:

令偏导等于0,得到极大似然估计量:

(4)

随机变量Zi,i=1,2,…,n服从参数为λ+μ的指数分布,即参数为的伽马分布。由伽马分布的可加性,

,则其密度函数为

的期望:

因此,λ(∧)是λ的无偏估计。

三、(共20分)令X1,X2,…,Xn,Xn+1为总体伯努利分布B(1,p)的样本,统计量为

前n个样本之和大于第n+1个样本的概率为

从而h(p)为p的函数。

(1)(6分)证明:是参数p的充分统计量。

(2)(6分)证明

是h(p)的无偏估计量。

(3)(8分)寻找h(p)的最小方差无偏估计(需要写出具体形式)。

解:(1)依题意有,随机变量Xi(i=1,2,…,n+1)的分布为

样本(X1,X2,…,Xn+1)的联合分布为

其中xi=0,1。将统计量代入得

P(X1=x1,X2=x2,…,Xn+1=xn+1)=pT(1-p)n+1-T

根据因子分解定理,是参数p的充分统计量。

(2)证明:统计量M(X1,X2,…,Xn+1)的期望

即E(M)=h(p)。因此,M(X1,X2,…,Xn+1)是h(p)的无偏估计量。

(3)由题意Xi~B(1,p),(i=1,2,…,n,n+1),由伯努利分布的性质

因此

是p的完备充分统计量,M(X1,X2,…,Xn+1)是h(p)的一个无偏估计,由定理知,将M(X1,X2,…,Xn+1)对求条件期望,则S(T)=E(M(X)|T(X))是h(p)的最小方差无偏估计。

在T(X)=t,(t=0,1,2,…,n+1)的条件下求条件期望:

其中,T(X)~B(n+1,p),

当T(X)=t=0时

当T(X)=t=1时

当T(X)=t=2时

当T(X)=t≥3时

故h(p)的最小方差无偏估计为

四、(共16分)令X1,X2,X3,X4,X5为总体伯努利分布B(1,p)的样本。考虑如下假设检验:

H0:p=1/2 v.s. H1:p=1/4

(1)(10分)寻找此假设检验的最优检验(显著水平为0.05)。

(2)(6分)计算上述检验的第一类与第二类错误概率大小。

解:(1)根据Neyman-Pearson定理,应通过似然比检验得到最优检验。似然函数为

当p=1/2和p=1/4时,对应的似然函数分别为

L(0.5,x)=0.55=1/32

因此,似然比为

当λ≥k时,拒绝H0,等价于时,拒绝H0。给定显著性水平α=0.05,使

当H0为真时,服从二项分布B(5,0.5),由于是离散分布,所以不能求出一个c值满足上式,此时应选择满足的最大c作为临界点。

当c≥2时

故最优检验的拒绝域为

即只有当X1,…,X5全为0时才拒绝原假设。

(2)犯第一类错误的概率,即原假设为真拒绝原假设的概率:

犯第二类错误的概率,即原假设为假但接受原假设的概率:

五、(共24分)假定A,B,C三种不同工艺铸造的零件强度X,Y,Z分别服从正态分布N(μi,σ2),i=1,2,3且X,Y,Z相互独立。为了解三种工艺铸造强度的差异,随机选取7,7,6个(共20个)分别用A,B,C三种工艺铸造的零件,测得其强度X1,X2,…,X7,Y1,Y2,…,Y7,Z1,Z2,…,Z6,令

(1)(8分)证明服从t分布。

(2)(6分)利用上述t分布求μ3的95%置信区间。

(3)(10分)若观测数据如下表所示,并分别计算得到三组样本均数与样本方差,sy2,sz2(见下表)。在α=0.05的显著性水平下,检验A,B,C三种工艺铸造的零件强度有无差异。

A,B,C三种工艺铸造的零件强度

解:(1)证明:

由正态分布的性质知

由于X,Y,Z相互独立,根据卡方分布的可加性,有

由t分布的定义知

整理得

(2)由t分布的性质

整理得

即μ3的95%置信区间为

其中t0.025(17)=2.11。

(3)构造假设检验:

H0:μ1=μ2=μ3;H1:μ1,μ2,μ3不全相等

全部观测值的总均值:

组间平方和:

组内平方和:

SSA的自由度为3-1=2;SSE的自由度为20-3=17。

当H0为真时,检验统计量

本题中F~F(2,17)。

代入数据计算得:

因此,拒绝原假设,即认为A、B、C三种零件的强度有显著差异。

附:

t分布的95%与97.5%分位数

F分布95%与97.5%分位数: