统计学简答题
1•什么是统计学?为什么统计学可以通过对数据的分析达到对事物性质的认
识?
统计学是一门关于统计设计、搜集、整理、分析统计数据的方法科学,具目的是探索数 据内在的数呈规律性,以达到对客观事物的科学认识。统计学可以通过对i 事务的分析达到对 性质的认识是有客观事物本身的特点和统计方法的特性共同决走的。(1)从客观
事物 方面来说,根据辩证法的基本原理”任何客观事物都是必然性与偶然性的对立统同样, 任佢I—个数据也都是必然性与偶然性共同作用的结果,是二者作用的对立统一。(2)从统 计方法来看,统计学提供了一系列的方法,专门用来收集数据、整理数据、显示数据的特征, 进而分析和探索(或推断)出事物总体的数臺规律性。
2・解释总体与样本、参数和统计量的含义。
(1)总体:是我们所要研究的所有基本单位(通常是人、物体、交易或者事件)的总 和,是在至
少一种共性的基础上由许多的个别事物所组成的整体。(2)样本:是总体 的一部分单位,是从总体中抽出的一部分被实际调查的子集合体。(3)参数:是对总体特 征的数星描述,是硏究者想要了解的总体的某种特征值,参数通常是一个未知的常数。(4 ) 统计呈:根据样本数据计算出来的一个呈,是对样本数据特征值的数量描述。
3・解释总体分布.样本分布和抽样分布的含义。
(1)总体分布:整体取值的概率分布规律,通常称为总体分布。(2)样本分布:从总 体中抽取容
呈为n的样本,得到n个样本观测值的概率分布,则为样本分布。(3 )抽样分 布:就是由样本n个观察值计算的统计量的概率分布。
4・简述描述统计学和推断统计学的概念及其联系。
(1)描述统计是用图形、表格和概括性的数字对数据进行描述的统计方法;推断统计 是根据
样本信息对总体进行估计、假设检验、预测或其他推断的统计方法。(2 )两者间联 系:一方面反映了统计发展的前后两个阶段,另一方面也反映了统计方法硏究和探索客观事 物內在数呈规律性的先后两个过程。
5.简述中心极限定理。
中心'极限走理就是对于一个抽自任意总体(均值为P ,方差为Z),样本容臺为n的随 机样本。当n充分大时(通常要求n>30),样本均值的抽样分布将近似于一^具有口、方差 为。2/“的正态分布。
6・解释置信水平、置信区间、显著性水平的含义,它们有什么联系。
(1) 置信水平:置信区间中包含总体参数真值的次数所占的比率,也称置信系数。(2 ) 置信区
间:在区间估计中,由样本统计臺所构造的总体参数的估计区间。(3)显著性水平: 是指当原假设实际上正确时,检验统计量落在拒绝域的概率。联系:置信区间越克,置信水 平越高,显薈性水平越低。
7・样本统计量的分布和总体分布的关系是什么?
由于现实中我们不可能将所有的样本都抽出来,因此,统计量的抽样分布实际上是一种 理论分布,但它与总体分布存在着密切的关系,以均值x的抽样分布为例,其抽样分布与原 有总体的分布有关,如果原有总体是正态分布,那么,无论样本容星的大小,样本均值也服 从正态分布。其分布的数学期望为总体均值,方差为总体方差的1/n ,即00。如果原有总 体的分布不是正态分布,就要看样本容呈的大小了,当n为大样本时(n>30),根据统计上 的中心极限走理可知,当样本容呈n增大时,不论原来的总体是否服从正态分布,样本均 值的抽样分布都将趋于服从正态分布。其分布的数学期望为总体均值,方差为总体方差的 l/no
8.抽样推断时为什么必须遵循随机原则抽取样本?
只有遵循随机原则从总体中抽取样本,才能排除主观因素等非随机因素对抽样调查的影 响,从而使样本单位的分布接近总体单位的分布,样本对总体才具有较大的代表性。这样, 根据样本的调查资料来估计和推断总体的数星特征才能较为科学和准确。
9简述假设检验的一般步骤。
(1) 陈述原假设Ho和备择假设Hi;(2)从所研究的总体中抽了不起一个随机样本;(3) 确走一
个适当的检验统计呈,并利用样本数据算出来具体数值;(4)确走一个适当的显著 性水平a ,并计算出其临界值,指走拒绝域;(5)将统计量的值与临界值进行比较,并做出 决策:若统计臺的值落在
拒绝域内,拒绝原假设Ho ,否则不拒绝原假设Ho。也可以直接利 用P值作出决策,P值小于显普性水平的拒绝Ho ,否则不拒绝Ho。
10 •简述第I类错误和第n类错误的概念,它们发生的概率之间存在怎样 的
关系?
第I类错误指,当原假设为真时,作出拒绝原假设所犯的错误,其概率为©。第II类 错误指当原假设为假时,作出接受原假设所犯的错误,其概率为P 0在其他条件不变时,Ct 增大,0减小;0增大,&减小。
11.简述众数.中位数和均值的特点和应用场合。
(1 )众数是将数据按大小顺序排队形成次数分配后,在统计分布中具有明显集中趋势 点的数
值,是数据一般水平代表性的一种。特点:可能没有众或有多个众数,最容易计算, 但不是永远存在,同时作为集中趋势代表值应用的场合很少,一般在农贸市场上。(2 )中
排序后,位置在最中间的数值。特点:很容易理解、很直观,它不受极端值的影
响。 (3)均值是算术平均数,是数据集中趋势的最主要测度值。特点:数癇言息 提取得最充分,在整个统计方法中应用最广,对经济管理和工程等实际工作也是最重要的方 法之一。
12.为什么要计算离散系数?
离散系数是用来对两组数据的差异程度进行相对比较的,因为比较相关的两组i 异程的差 度时,方差和标准差是以均值为中心计算出来的,受变呈值水平和计量单位的影响r因 而有时直接比较方差是不准确的,需要剔除均值大小不等的影响,计算并比较离散系数。
13•方差分析的基本假设有那些?
(1) 每个总体都应服从正态分布。也就是说,对于因素的每一个水平,其观测值是来自正态
分布总体的简单随机样本。(2 )各个总体的方差。2必须相同。也就是说,对于各组观察数 据,是从具有相同方差的正态总体中抽取的。(3)观察值是的。
14. 一组数据的分布特征可以从那几个方面进行测定?
—组数据的分布特征可以从以下3个方面逬行测度:(1)集中追势的测度(众数、中 位数、分位数、均值、几何平均数、切尾均值\\ (2)离散程康的测度(极差、内距、方差 和标准差、离散系
数X (3)偏态与峰度的测度(偏态及其测度、峰度及其测度\\
15・简述样本容量与置信水平、总体方差、允许误差的关系。
样本容臺与置信水平成正比,在其他条彳牛不变的情况下,置信水平越大,所需的样本容 呈也就越大;样本容呈与总体方差成正比,总体的差异越大,所要求的样本容呈也越大;样 本容臺与允许误差成反比,可以接受的允许误差越大,所需的样本容臺就越
16・比较单侧检验和双侧检验的区别。
(1) 问题的提法不同,双侧检验硏究的是新方法与旧方法是否有差异;单侧检验硏究 的是新
方法明显好于旧方法还是新方法明显不如旧方法。(2)建立假设的形式不同,双侧检 验的假设是
HO: u=uO, Hl: u HUO洋侧检验的假设是HO: u 17. 如何理解权数的意义?在什么情况下,应用简单算术平均数和加权算术平均 数计算的结果是一致的? 加权算术平均数中的权数,指的就是标志值出现的次数或各组次数占总次数的比重。在计算 平均数时,由于出现次数多的标志值对平均数的形成影响大些,出现次数少的标志值对平均 数的形成影响小些,因此就把次数称为权数。在分组数列的条件下,当各组标志值出现的次 数或各组次数所占比重均相等时,权数就失去了权衡轻重的作用,这时用加权算术平均数计 算的结果与用简单算术平均数计算的结果相同。 18. 解释置信水平为95%的置信区间的含义。 总体参数是固走的,未知的,置信区间是一个随机区间。置信水平为95%的置信区间的含 义是指,在相同条件下多次抽样下,在所有构造的置信区间里大约有95%包含总体参数的 真值。 19. 什么是显著性水平?它对于假设检验决策的意义是什么? 假设检验中犯第一类错误的概率被称为显薈性水平。显著性水平通常是人们事先给出的一个 值,用于检验结果的可靠性度呈,但确走了显薈性水平等于控制了犯第一错误的概率,但犯 第二类错误的概率却是不确走的,因此作出\"拒绝原假设\"的结论,其可靠性是确走的,但 作出\"不拒绝原假设\"的结论,其可靠性是难以控制的。 20. 在总量指标的两因素分析中”指数体系如下: 工皿_工皿工皿 -------------- = ----------------- X ---------------- Z內弘工內s S Po% 工 一 S PMO=(E 阳厂 E \"冷)+(工 ”()4 一 E 阳。) 以下计算出来的是一组与上述指数体系相对应的销售额、销售价格和销售量 的数据。请根据以下数据解释该指数体系的含义。 r 130%=108.33%X120% L2160万元=600万元+1560万元 答:这表明报告期与基期相比z销售额增长了 30% ,即2160万元z这是由于 销售价格提高了 8.33% ,使销售额增加了 600万元和销售量增加了 20% z使销 售额增加了 1560万元这两个因素共同作用的结果。 计算题 1. 第四章例题。 2. 第五章习题的第2、4、6题 3.. 第六章一个总体均值的检验相关例题。 4.第七章习题的第1、3、5、7题。 5.. 第八章:简单线形回归及其方差分析表。 6. 第九章习题的第1、3、5、7题。 7. 第十章习题的第1、3、6、7题。 注:对于判断题和选择题中的需要计算的内容要从所要掌握的内容去复习。 (20分)从一批零件中随机抽取36个,测得其平均长度为149.5cm,标准差为1・93cm。 (1) 试确龙该种零件平均长度95%的置信区间。 (2) 若要求该种零件的标/馬废应为150cm,用假设检验的方法和步骤检验该批零件 符 合标准要求?(° = °・°5)。 (3) 在上而的估计和检验中,你使用了统计中的哪一个重要左理?请简要解释这一泄 理。 ⑴壬土zC = 149.5±1.96x沽=149.5±0.63 (148.87. 150.13) (2) H© : p = 150 , H、; p 丰 150 ° 149 5-ISO 检验统计量z = 二 =-1.55,由于z = —1・55 v s = 1.96。不拒绝原假设。 1.93 ,,届 「 符合要求。 (3)使用了中心极限左理匚从均值为“、方差为,的总体中,抽取容量为川的随机 样本,当”充分大时(通常要求n>30),样本均值戈的抽样分布近似服从均值为“、方差 为//〃的正态 分布。 一.((20分)一家产品销售公司在30个地区设有销售分公司。为研究产品销售量(V)与该公 司的销售价格(xi).各地区的年人均收入仇)、广告费用(心)之间的关系,搜集到30个 地区的有关数据。利用Excel得到下面的回归结果2 = 0.05): 方差分析表 变差来源 df SS MS F Significance F 回归 残差 总计 参数估汁表 40024.7 29 13458586.7 Coefficients 75.1025 — 标准误差 — — t Stat 3. 1039 -3. 6958 8.88341E-13 — — P-value 0. 00457 0. 00103 Intercept 2445.0213 31.74 X Variable 1 -117.8861 X Variable 2 X Variable 3 80. 6107 0. 5012 14. 7676 0. 1259 5. 4586 3. 9814 0. 00001 0. 00049 (1) 将方差分析表中的所缺数值补齐。 (2) 写出销售量与销售价格、年人均收入、广告费用的多元线性回归方程,并解释各回归 系 数的意义。 (3) 检验回归方程的线性关系是否显著? (4) 检验各回归系数是否显著? (5) 计算判左系数#解释它的实际总义。 (6) 计算估计标准误差%,并解释它的实际意义。 (1) 变差来源 回归 残差 总计 df 3 26 29 SS MS F 12026774.1 1431812.6 13458586.7 40024.7 55069.7 — 72.8 — — Significance F 8.88341E-13 — — (2) y = 75.10^)-117.8861 x, + 80.6107x. + 0.5012勺 回归系数A =-117.8861表示:在年人均收入和广告费用不变的条件下,销售价 格每增 加1元,销售最平均减少117.8861个单位:p. =80.6107表示:在年销售价格和广 告费用不变的条件下,人均收入每增加1元,销售量平均增加80.6107个单位;A =0.5012 表示:在年销售价格和人均收入不变的条件下,广告费用增加1元,销售量平均增加0.5012 个单位。 (3) 由于Significance F=8. 88341E-13<0. 05o拒绝原假设,线性关系显著。 (4) 各回归系数检验的P值分别为:0.00103. 0.00001、0.00049,均小于0. 05,表 明各回 归系数均显著。 (5) R2 = 120267741 = ,36% o它表示在销售量的总变差中,被销售价格、年人 13458586.7 均收入、广告费用与销售虽:之间的线性关系所解释的比例为.36%o ⑹”曉兽^34.67。它表示销售价格、年人均收入和广告费用预测销售量 时的平均预测误差为234.67元。 一、某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克。现从某天生 产的一批产品中按重复抽样随机抽取50包进行检査,测得每包重量(克)如下: 每包重量(克) 包数 2 96 〜98 3 98 〜100 34 100〜102 7 102〜104 4 104〜106 50 合计 已知食品包重服从正态分布,要求: (1) 确左该种食品平均重S95%的宜信区间: (2) 如果规泄食品重量低于100克属于不合格,确左该批食品合格率95%的置信 区 间; (3)采用假设检验方法检验该批食品的重量是否符合标准要求?(写出检验的具体 (1) 戈= 101.32, s = 1.63 a (100.87, 101.77) x±z 1.63 = 101.32±1.96x = 101.32 ±0.45 /? = —= 0.10 50 (2) P±% V =0.l0±l.%x I 50 巴=0.10±0.08 (2%, 18%) (3) : // = 100 ,耳:“h 100 -=101.32-100 = 5 严 检验统计量「g,® 一 ,由于Z = 5.73 >za/2= 1.96 o拒绝原假设。不符合要 求。 二、随着零售业市场竞争的日益加剧,各零售商不断推出新的促销策略。物通百货公司准 备利用五一假日黄金周采取部分商品的大幅度降价策略,旨在通过降价贏得顾客、提高商 品的销售额,同时也可以进一步调整商品的结构。为分析降价对销售额带来的影响,公司 收集的降价前一周和降价后一周集中主要商品的有关销售数据,如下表: 几种主要商品一周的销售数据 商品名称 甲 讣量单位 台 价格(元) 降价前 降价后 销售量 降价前 降价后 3200 2560 5() 70 乙 套 516 860 120 180 240 336 丙 件 180 126 (1)降价后与降价前相比,三种商品的总销售额增长的百分比是多少?销售额增长 的绝对值是多少? (2) 以降价后的销售量为权数,汁算三种商品的平均降价幅度是多少?由于降价而 减少的销售 额是多少? (3) 以降价前的价格为权数,计算三种商品的销售量平均增长幅度是多少?由于销 售量增长而 增加的销售额是多少? (4) 说明你在分析上述问题时采用的是什么统讣方法?采用该方法的理由是什么? (1)三种商品的总销售额增长的百分比: 善亞7 = 2560x7()+5唤⑻)+126x336+ 些竺_—0262% + 2.62% 销售额增 PE 3200 x 50 + 860 x 120 +180 X 240 3000 长的绝对值=-》>風=314416-3000=8016(元) (2)三种商品的平均降价幅度: 品+空m型竺岀+ 沁亠7】.58% + -2&42%由于 X p 网 3200 X 70 + 860x180+180x336 439280 降 价 而 减 少 的 销 售 额 = 工內% 一工pg =314416—439280=—1248(元) (3)三种商品的销售量平均增长幅度: = 3200x70+860x180+叫336亠 439280亠]43.37%亠43.37% 由于 3200 x 50 + 860 x 120 +180x 240 3000 销售量增长而增加的销售额= 工几6 一工几弘=439280- 3000 = 13288« 元) (4)采用的是统计指数方法。由于所要分析的是三种不同商品销售额、价格和销售量的综 合变动。要进 行综合并进行对比,通常要采用指数的方法。 课后习题答案 7.1 尸=4.6574 设。 7.5尸地区=0*0727 <凡a =6.9443 (或戶_讪诞= 0.9311> a = 0.05),不能拒绝原假 设。F包装方法=3.1273 < FOO5 = 6.9443 (或— value = 0.1522> a = 0.05),不能 拒绝原假设。 9.1 (1) 30X 1.063 xl.052 = 30X 1.3131 = 39.393 (万辆) ⑵ ^(30x2)/(30x1.078) -1 = ^2/1.078 -1 = 7.11% (3) 设按7.4%的增长速度n年可翻一番 则有 1.074\" =60/30 = 2 所以 n = log2 /log 1.074 = 9.71 (年) 故能提前0.29年达到翻一番的预泄目标。 9.3 (1)发展总速度(1+ 12%)'x (1 + 10%)以(1 + 8%)—259.12% 平均增长速度二呼259.12% -1= 9.92% (°)500x(l + 6%)2 =561.8 (亿元) y =丄 yyy= —= 142.5 ■ 4厂4 (亿元), (3)平均数 2002年一季度的计划任务:105%x 142.5 = 149.625 (亿元)。 10.1 (1)L = = 104.16%, L =l/!l^L = zl2Lli = 107.73%: ° S^/oPo 2039.2 卩工叭 2039.2 (2) p =.工殂/工=.241 . = ]03.83% p =》3/L = ^1 = IO7.39%。 '工 qm 2196.8 \" S P.qx 2124 (3) 略。 10.3 (1) p = Zdllk = ..945<)()_ = 92.83%, Pf = ^q'Pl = ■ 171X= 93.27% o \"工务 Z| 101800 q E<7oPi 125550 (2)略。 10.6 (l)360xl2%=43.2:(2)112%-105% = 106.67%. 360x 6.67% = 24.0 : ⑶ 360x 106.67% x 5% = 19.2:(4)106.67% x 105% = 112%, 24.0 +19.2 = 43.2。 107 () ⑴X鴿脚6,呂签2.6967, ^=§§ = 23483 (2)屮亠 2367 = 2.6967, 9&60% x 114.84% = 113.23% 23816 2.3483 2.3816 ⑶= 22^ x 2,6967 120.74% = 106.63%x 113.23% , 968 2 309.6 + 658.6 4668 1960 2.3816 因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- jqkq.cn 版权所有 赣ICP备2024042794号-4
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务