http://wwwamazoncn/s/478-3353544-2641246pageletid=headsearch&searchType=&i=books&keywords=%E7%BB%9F%E8%AE%A1%E5%AD%A6%E7%AC%AC%E4%B8%89%E7%89%88%E8%AF%BE%E5%90%8E%E4%B9%A0%E9%A2%98%E7%AD%94%E6%A1%88+%E8%B4%BE%E4%BF%8A%E5%B9%B3&searchKind=keyword&Gox=15&Goy=10
初试部分,有《概率论》,李贤平,高等教育出版社;《数理统计基础》,陆璇,清华大学出版社;《概率论与数理统计》,茆诗松、周纪芗,中国统计出版社;《应用回归分析》,何晓群等编 ,中国人民大学出版社;《统计学》,贾俊平等编, 中国人民大学出版社。
复试部分,专业综合考试统计学、概率论、应用回归分析、时间序列分析、抽样技术、多元统计分析、非参数统计、国民经济核算(以中国人民大学出版社出版的为主)。
说一下复习的时间安排吧,我是9月份正式准备考研,之前的暑假在家学了点数学和英语。所以时间相对来说比较紧,强烈建议考研的同志们尽早准备!
8:30—9:00前期是看(注意是看,后边会讲)英语单词,中期做一篇英语阅读,后期又开始看单词。
9:00—11:40固定的数学时间,做全书,看视频,做全书,做张宇,做真题,做错题,大概就是这个顺序。
13:00—15:00解决上午的数学遗留,然后开始看政治,我留给政治的时间少得可怜。
15:10—20:00学习专业课,因为我专业课开始比较晚,所以留的时间比较多,中间去掉吃饭休息时间大概有4个小时。
20:00—23:00学英语,我大部分时间都拿来做阅读了。
这个时间安排不会对所有人都适合,还是要根据自己的情况来安排。有了计划尽量按计划来,不过有时候学的比较烦了,可以多学一些自己喜欢的那科。
据我所知,贾俊平的《统计学》确实是考研统计学专业课教材中的主要参考书籍,但并不代表其他书籍就不会涉及考点。考生应该根据考试大纲来选择适合自己的辅导教材。另外,多看几本书对于扩展知识面、理解概念也是有帮助的。但在备考过程中应该注重思路方法的学习,掌握基本概念及其应用能力,准确把握考点以及解题方法,这样才能顺利通过考试。
第四章练习题答案
41 (1)众数:M0=10; 中位数:中位数位置=n+1/2=55,Me=10;平均数:
(2)QL位置=n/4=25, QL=4+7/2=55;QU位置=3n/4=75,QU=12
(3)
(4)由于平均数小于中位数和众数,所以汽车销售量为左偏分布。
42 (1)从表中数据可以看出,年龄出现频数最多的是19和23,故有个众数,即M0=19和M0=23。
将原始数据排序后,计算中位数的位置为:中位数位置= n+1/2=13,第13个位置上的数值为23,所以中位数为Me=23
(2)QL位置=n/4=625, QL==19;QU位置=3n/4=1875,QU=265
(3)平均数 600/25=24,标准差
(4)偏态系数SK=108,峰态系数K=077
(5)分析:从众数、中位数和平均数来看,网民年龄在23-24岁的人数占多数。由于标准差较大,说明网民年龄之间有较大差异。从偏态系数来看,年龄分布为右偏,由于偏态系数大于1,所以,偏斜程度很大。由于峰态系数为正值,所以为尖峰分布。
43 (1)茎叶图如下:
茎 叶 频数
5
6
7 5
6 7 8
1 3 4 8 8 1
3
5
(2) 63/9=7,
(3)由于两种排队方式的平均数不同,所以用离散系数进行比较。
第一种排队方式:v1=197/72=0274;v2=0714/7=0102由于v1>v2,表明第一种排队方式的离散程度大于第二种排队方式。
(4)选方法二,因为第二种排队方式的平均等待时间较短,且离散程度小于第一种排队方式。
44 (1) 8223/30=2741
中位数位置=n+1/2=155,Me=272+273/2=2725
(2)QL位置=n/4=75, QL==(258+261)/2=2595;QU位置=3n/4=225,QU=(284+291)/2=2875
(3)
45 (1)甲企业的平均成本=总成本/总产量=
乙企业的平均成本=总成本/总产量=
原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
46 (1)(计算过程中的表略), 51200/120=42667
SK=0203 K=-0688
47 (1)两位调查人员所得到的平均身高应该差不多相同,因为均值的大小基本上不受样本大小的影响。
(2)两位调查人员所得到身高的标准差应该差不多相同,因为标准差的大小基本上不受样本大小的影响。
(3)具有较大样本的调查人员有更大的机会取得最高或最低者,因为样本越大,变化的范围就可能越大。
48 (1)要比较男女学生体重的离散程度应该采用离散系数。女生体重的离散系数为v女=5/50=01,男生体重的离散系数为v男=5/60=008,所以女生的体重差异大。
(2)男生: 60×22=132(磅),s=5×22=11(磅)
女生: 50×22=110(磅),s=5×22=11(磅)
(3)假定体重为对称分布,根据经验法则,在平均数加减1个标准差范围内的数据个数大约为68%。因此,男生中大约有68%的人体重在55kg-65kg之间。
(4)假定体重为对称分布,根据经验法则,在平均数加减2个标准差范围内的数据个数大约为95%。因此,男生中大约有95%的人体重在40kg-60kg之间。
49 通过计算标准分数来判断:
该测试者在A项测试中比平均分数高出1个标准差,而在B项测试中只高出平均分数05个标准差,由于A项测试的标准分数高于B项测试,所以,A项测试比较理想。
410 通过标准分数来判断,各天的标准分数如下表:
日期 周一 周二 周三 周四 周五 周六 周日
标准分数Z 3 -06 -02 04 -18 -22 0
周一和周六两天失去了控制。
411
(1)应该采用离散系数,因为它消除了不同组数据水平高低的影响。
(2)成年组身高的离散系数:
幼儿组身高的离散系数:
由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。
412
(1)应该从平均数和标准差两个方面进行评价。在对各种方法的离散程度进行比较时,应该采用离散系数。
(2)下表给出了各种方法的主要描述统计量。
方法A 方法B 方法C
平均 1656
中位数 165
众数 164
标准差 213
极差 8
最小值 162
最大值 170 平均 12873
中位数 129
众数 128
标准差 175
极差 7
最小值 125
最大值 132 平均 12553
中位数 126
众数 126
标准差 277
极差 12
最小值 116
最大值 128
从三种方法的集中趋势来看,方法A的平均产量最高,中位数和众数也都高于其他两种方法。从离散程度来看,三种方法的离散系数分别为: , , 。方法A的离散程度最小,因此,应选择方法A。
413
(1)用方差或标准差来评价投资的风险。
(2)从直方图可以看出,商业类股票收益率的离散程度较小,说明投资风险也就较小。
(3)从投资风险角度看,应该选择风险较小的商业类股票。当然,选择哪类股票还与投资者的主观判断有很大关系。
第五章练习题答案
51 (1)平均分数是范围在0-100之间的连续变量,Ω=[0,100]
(2)已经遇到的绿灯次数是从0开始的任意自然数,Ω=N
(3)之前生产的产品中可能无次品也可能有任意多个次品,Ω=[10,11,12,13……]
52 设订日报的集合为A,订晚报的集合为B,至少订一种报的集合为A∪B,同时订两种报的集合为A∩B。
P(A∩B)=P(A)+ P(B)-P(A∪B)=05+065-085=03
53 P(A∪B)=1/3,P(A∩ )=1/9, P(B)= P(A∪B)- P(A∩ )=2/9
54 P(AB)= P(B)P(A∣B)=1/31/6=1/18
P( ∪ )=P( )=1- P(AB)=17/18
P( )=1- P(B)=2/3
P( )=P( )+ P( )- P( ∪ )=7/18
P( ∣ )= P( )/P( )=7/12
55 设甲发芽为事件A,乙发芽为事件B。
(1)由于是两批种子,所以两个事件相互独立,所以有:P(AB)= P(B)P(B)=056
(2)P(A∪B)=P(A)+P(B)-P(A∩B)=094
(3)P(A )+ P(B )= P(A)P( )+P(B)P( )=038
56 设合格为事件A,合格品中一级品为事件B
P(AB)= P(A)P(B∣A)=096075=072
57 设前5000小时未坏为事件A,后5000小时未坏为事件B。
P(A)=1/3,P(AB)=1/2, P(B∣A)= P(AB)/ P(A)=2/3
58 设职工文化程度小学为事件A,职工文化程度初中为事件B,职工文化程度高中为事件C,职工年龄25岁以下为事件D。
P(A)=01 P(B)=05, P(C)=04
P(D∣A)=02, P(D∣B)=05, P(D∣C)=07
P(A∣D)=
同理P(B∣D)=5/11, P(C∣D)=28/55
59 设次品为D,由贝叶斯公式有:
P(A∣D)= =0249
同理P(B∣D)=0112
510 由二项式分布可得:P(x=0)=025, P(x=1)=05, P(x=2)=025
511 (1) P(x=100)=0001, P(x=10)=001, P(x=1)=02, P(x=0)=0789
(2)E(X)=1000001+10001+102=04
513 答对至少四道题包含两种情况,对四道错一道,对五道。
C54 C65 =1/64
514 由泊松分布的性质有:
P(X=1)= ,P(X=2)= ,可得 =2
P(X=4)=2/3e
515
所以,当k= -1和k= 时P(x=k)最大。
516 (1)P( >2)= P(x>2)+ P(x<-2)= (05)+1- (25)=06977
由于N(3,4)关于均值3对称,所以P(x>3)=05
517 P(120<x<200)=P(
,
518 (1)
(2)
第七章 练习题参考答案
71 (1)已知 =5,n=40, =25, =005, =196
样本均值的抽样标准差 = =
(2)估计误差(也称为边际误差)E= =196079=155
72(1)已知 =15,n=49, =120, =005, =196
(2)样本均值的抽样标准差 = = 214
估计误差E= =196 42
(3)由于总体标准差已知,所以总体均值 的95%的置信区间为:
=120 196214=120 42,即(1158,1242)
73(1)已知 =85414,n=100, =104560, =005, =196
由于总体标准差已知,所以总体均值 的95%的置信区间为:
=104560 196 104560 16741144即(87818856,121301144)
74(1)已知n=100, =81,s=12, =01, =1645
由于n=100为大样本,所以总体均值 的90%的置信区间为:
=81 1645 81 1974,即(79026,82974)
(2)已知 =005, =196
由于n=100为大样本,所以总体均值 的95%的置信区间为:
=81 196 81 2352,即(78648,83352)
(3)已知 =001, =258
由于n=100为大样本,所以总体均值 的99%的置信区间为:
=81 258 81 3096,即(7794,84096)
75(1)已知 =35,n=60, =25, =005, =196
由于总体标准差已知,所以总体均值 的95%的置信区间为:
=25 196 25 089,即(2411,2589)
(2)已知n=75, =1196,s=2389, =002, =233
由于n=75为大样本,所以总体均值 的98%的置信区间为:
=1196 233 1196 643,即(11317,12603)
(3)已知 =3419,s=0974,n=32, =01, =1645
由于n=32为大样本,所以总体均值 的90%的置信区间为:
=3419 1645 3419 0283,即(3136,3702)
76(1)已知:总体服从正态分布, =500,n=15, =8900, =005, =196
由于总体服从正态分布,所以总体均值 的95%的置信区间为:
=8900 196 8900 25303,即(864697,915303)
(2)已知:总体不服从正态分布, =500,n=35, =8900, =005, =196
虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值 的95%的置信区间为:
=8900 196 8900 16565,即(873435,906565)
(3)已知:总体不服从正态分布, 未知, n=35, =8900,s=500, =01, =1645
虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值 的90%的置信区间为:
=8900 1645 8900 13903,即(876097,903903)
(4)已知:总体不服从正态分布, 未知, n=35, =8900,s=500, =001, =258
虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值 的99%的置信区间为:
=8900 258 8900 21805,即(868195,911805)
77 已知:n=36,当 =01,005,001时,相应的 =1645, =196, =258
根据样本数据计算得: =332,s=161
由于n=36为大样本,所以平均上网时间的90%置信区间为:
=332 1645 332 044,即(288,376)
平均上网时间的95%置信区间为:
=332 196 332 053,即(279,385)
平均上网时间的99%置信区间为:
=332 258 332 069,即(263,401)
78 已知:总体服从正态分布,但 未知,n=8为小样本, =005, =2365
根据样本数据计算得: =10,s=346
总体均值 的95%的置信区间为:
=10 2365 10 289,即(711,1289)
79 已知:总体服从正态分布,但 未知,n=16为小样本, =005, =2131
根据样本数据计算得: =9375,s=4113
从家里到单位平均距离的95%的置信区间为:
=9375 2131 9375 2191,即(718,1157)
710 (1)已知:n=36, =1495, =005, =196
由于n=36为大样本,所以零件平均长度的95%的置信区间为:
=1495 196 1495 063,即(14887,15013)
(2)在上面的估计中,使用了统计中的中心极限定理。该定理表明:从均值为 、方差为 的总体中,抽取了容量为n的随机样本,当n充分大时(通常要求 ),样本均值的抽样分布近似服从均值为 ,方差为 的正态分布。
712 (1)已知:总体服从正态分布,但 未知,n=25为小样本, =001, =2797
根据样本数据计算得: =16128,s=0871
总体均值 的99%的置信区间为:
=16128 2797 16128 0487,即(1564,1662)
713 已知:总体服从正态分布,但 未知,n=18为小样本, =01, =174
根据样本数据计算得: =1356,s=78
网络公司员工平均每周加班时间的90%的置信区间为:
=1356 174 1356 32,即(1036,1676)
714 (1)已知:n=44,p=051, =001, =258
总体比例 的99%的置信区间为:
=051 258 =051 019,即(032,07)
(2)已知:n=300,p=082, =005, =196
总体比例 的95%的置信区间为:
=082 196 =082 004,即(078,086)
(3)已知:n=1150,p=048, =01,, =1645
总体比例 的90%的置信区间为:
=048 1645 =048 002,即(046,05)
715 已知:n=200,p=023, 为01和005时,相应的 =1645, =196
总体比例 的90%的置信区间为:
这么多年过去了,虽然我想你大概也不需要答案了,但我想搜这个问题的人应该会用到吧,我说一下个人理解,我大学本科就是学的贾俊平版本的《统计学》,比起数三来说,真的是太简单了。其中原因之一是数三的涉及的学科以及知识面显而易见比统计学广一点,另外,贾俊平版本的《统计学》真的很简单,个人认为比袁卫的简单一点,但是内容更详细,尤其是在推断统计,详细的多,对于初学者来说,贾俊平的《统计学》很好“上手”。
欢迎分享,转载请注明来源:品搜搜测评网