Free考研资料

标题: 再不会为“样本方差”的n,n-1纠结了。 [打印本页]

作者: 天地人勇往直前    时间: 14-10-3 15:15
标题: 再不会为“样本方差”的n,n-1纠结了。
本帖最后由 天地人勇往直前 于 14-10-3 15:19 编辑

分析到这里,我才明白了,笔版曾经跟我说的
“有使用价值的就是Sn-1,而Sn没有什么价值。”
“如果没搞清楚“统计研究的是总体”,就会在细节上陷入混乱。”

(PS:样本方差总是比总体方差小,是有偏的,当用样本方差做总体的方差估计值时,是偏小的,需要处理,这个处理就是n变为n-1。∑x2/n变为∑x2/n-1)(参考行为科学统计P94)

行为科学统计(第七版),在这本书里面。
方差有两种,要么是总体方差,要么是样本方差。

“总体方差”就是被定义为σ2=ss/N(P95)
“样本方差”就是被定义为s2=ss/n-1。(P97)
(张厚粲书中的S2n-1=ss/n-1,张书中的‘样本方差’不等于ss/n-1)

在定义“样本方差”之前,书中说了这么一句话“为了矫正偏误,当使用样本数据的时候,需要对变异性的计算作出调整。”(P97)

即,在计算样本方差的时候就自动进行了调整(n变为n-1)
于是在这样一个体系中根本不存在s2=ss/n(张厚粲书中的Sn)这么一个概念。

张厚粲书中
把“标准差”用s或SD表示,当表示总体的时候用σ表示。
“样本方差”用s2表示。且s2=SS/n。(P87)
因为这个时候,没有对总体进行估计,不需要进行无偏估计的处理,不需要将n变为n-1。
在参数估计一章中,参数的良好估计量的标准有“无偏性”,这时才提出了S2n-1=SS/n-1这么一个概念。

于是,很矛盾的就是,当“样本方差”这个概念出现的时候,到底指的是“SS/n”,还是“SS/n-1”就比较困惑了。


其实,当我终于分析明白之后,这个Sn与Sn-1的细节,“样本方差”指的是什么这个细节,真的不重要了。因为我们学习这个知识,在运用的时候自然会说明白,而不仅仅是为了答题。

呵呵,不知道我说清楚了没有,或许这是个大家早已明白,而只有我还傻傻分布清的问题,哈哈~

感谢水中月绕云分享的《行为科学统计》一书。

外国的书厚,内容多,但有些细节的解释真的对理解很有帮助,比自己假设验证来得方便多了。
作者: 笔为剑    时间: 14-10-3 15:28
你前面是自己把“样本方差”定义为“样本自己的方差”。在这个前提之下,你就听不进我的意见了。
现在你自己明白了,很好。那你现在还觉得我是故意绕开了你的问题吗?


作者: 天地人勇往直前    时间: 14-10-3 15:35
笔为剑 发表于 14-10-3 15:28
你前面是自己把“样本方差”定义为“样本自己的方差”。在这个前提之下,你就听不进我的意见了。
现在你自 ...

恩,是我自己开始没把问题表述清楚[a:38]
作者: bujianxin    时间: 14-10-3 18:49
国外那本书在细节方面写的很详细,对于看张厚粲书不明白的人是个好的备用书.
当时看的时候有一种豁然开朗的感觉..
好久没看..里面的内容都忘光了
作者: 天地人勇往直前    时间: 14-10-3 18:58
bujianxin 发表于 14-10-3 18:49
国外那本书在细节方面写的很详细,对于看张厚粲书不明白的人是个好的备用书.
当时看的时候有一种豁然开朗 ...

嗯,现在还剩4个章节没看,准备两本书结合着看吧,前面的章节也没心思在再从头看一遍了,如果没有遇到新问题的话,呵呵
忘光了好啊,和张无忌一样的,已经领悟到精髓内化了,哈哈
作者: hankyoung1324    时间: 14-10-3 19:53
看看天地人的分享
作者: 天地人勇往直前    时间: 14-10-3 20:26
hankyoung1324 发表于 14-10-3 19:53
看看天地人的分享

嘿嘿,其实也是别人的分享,我只是方便一下,摆在这里[t:9]
作者: 水中月绕云    时间: 14-10-3 20:53
提示: 作者被禁止或删除 内容自动屏蔽
作者: 兮哩乎图    时间: 14-10-3 22:21
我们使用的样本方差是不是都用n-1来估计啊?
作者: 天地人勇往直前    时间: 14-10-3 22:27
兮哩乎图 发表于 14-10-3 22:21
我们使用的样本方差是不是都用n-1来估计啊?

你有张厚粲的书没,在张厚粲的书中“样本方差”这4个汉字代表的不是用n-1算来的。比如P233页,例8-4中的“标准差”。
作者: 冰潇风哮    时间: 14-10-4 00:58
[a:33] [a:33] [a:33] 讲的非常清楚,天地人好有钻研精神。我最近也看了其他的书,发现都没有Sn的概念,还是行为科学统计写的最细最清楚。今天看了你的帖子又有收获,更清楚了,非常感谢分享~~~
作者: 苏杭dalala    时间: 14-10-4 17:52
嗯 张厚粲书里的都是Sn 混乱了好久
作者: 笔为剑    时间: 14-10-4 22:18
苏杭dalala 发表于 14-10-4 17:52
嗯 张厚粲书里的都是Sn 混乱了好久

那不是张厚粲的书,那是徐建平写的书,挂了张厚粲的名字而已。

作者: 冬笋要奋斗    时间: 14-10-5 08:10
哦哦!!谢谢!
作者: xingdeweixiao    时间: 14-10-5 13:23
谢谢楼主分享
作者: wanhan147    时间: 14-10-5 18:56
楼主这么一说 我也觉得清楚了好多 万分感谢
作者: kai_wx    时间: 14-10-7 14:55
其实Sn. Sn-1都是样本方差对总体的估计~估计估计自然是不精确的数值~都是不精确的值哪有什么对错之分~但却又好坏之分~不难看出Sn-1优于Sn
(这是我自己的理解)

作者: 冷雨敲窗夜未眠    时间: 14-10-7 16:34
have a look
作者: 天地人勇往直前    时间: 14-10-7 17:38
kai_wx 发表于 14-10-7 14:55
其实Sn. Sn-1都是样本方差对总体的估计~估计估计自然是不精确的数值~都是不精确的值哪有什么对错之分~但 ...

同学你好。我觉得。
首先Sn的值是没有意义的,作总体的估计值是有偏的。
另外,我觉得你把统计学中的这个估计概念与生活中的估计概念弄混了。

统计学中用,小概率事件进行决策,认为小概率事件在一次事件中是不会发生的。这也是估计,但却能为我们做出肯定或否定的决策。
我们要推断的是总体的值,样本来自总体但不等于总体。对样本值进行计算,如果按照原有的公式ρ2=SS/n计算,来估计总体的值,是绝对肯定会变小的,是有偏的,是可以通过n-1变换来解决这种有偏性,变成无偏性的。为什么还一定要用肯定偏小不准确的n呢?

来举个例子说明,你是把统计学中的估计,与生活中的估计弄混淆了。

π=3.14159268....
我们计算圆的时候一般用的是3.14,那是手动计算,那是估计,那是我们无法手动用其精准值来计算。当然你说我精确一点用3.1416也行,这也是估计,我在简单点用3也是估计。
这里的估计,就是你说的“估计估计”,估计估计而已。

但是你要是计算全国31888个圆的面积总和的时候你要选用什么来作为估计?我们能说,“反正是估计估计,用3也行吧。”吗?不能,我们当然是用计算机用尽可能准确的π值来估计。但π是无限循环小数,仍然是个估计值。但却是最科学严谨的估计值。
作者: kai_wx    时间: 14-10-7 23:15
天地人勇往直前 发表于 14-10-7 17:38
同学你好。我觉得。
首先Sn的值是没有意义的,作总体的估计值是有偏的。
另外,我觉得你把统计学中的这 ...

楼上这位同学好(^0^)/
我并没有把他们混淆,因为他们本就是一个意思。学术的含义就算不全部是民用词汇的意思,也算是其引申。
在估计这个问题是~很多数理学家都会探讨很多估计值~比如一元线性回归模型中,对参数的估计有最小二乘法、最小一乘法、全最小一乘法等等~这些方法计算出来的数不尽相同~再比如对数据的集中趋势的估计也有中数、从数、平均数三个~这些估计值都有好坏之分~评价标准是设定好的无偏,有效,一致三原则。
当然~理论上说选择无偏有效一致的估计值是最好的~但是可以根据不同任务或目的选择别的估计值做参考~就好比你计算3万多个园来反驳我不能用3来估计派~我也可以说计算一个直径为3个单位的圆来反驳你没必要用真正的派3.141592653589793...(以致无穷)来计算这个圆的面积,只需要用3.14哪怕这个数偏小
就因为选择估计值是按需选择
作者: 天地人勇往直前    时间: 14-10-8 11:54
kai_wx 发表于 14-10-7 23:15
楼上这位同学好(^0^)/
我并没有把他们混淆,因为他们本就是一个意思。学术的含义就算不全部是民用词汇的 ...

按需选择,这确实是个无法反驳的一句话。什么东西都是按需选择的。
但需要知道”需“是什么,”选择“是什么。
而我必须要说的是,Sn绝不是被需要的选择。
理由看1楼。

“有使用价值的就是Sn-1,而Sn没有什么价值。”
“如果没搞清楚“统计研究的是总体”,就会在细节上陷入混乱。”
如果不能理解这两句话,那么其他的就真不好在讨论了。

作者: kai_wx    时间: 14-10-8 18:51
天地人勇往直前 发表于 14-10-8 11:54
按需选择,这确实是个无法反驳的一句话。什么东西都是按需选择的。
但需要知道”需“是什么,”选择“是 ...

看到你说“Sn绝不是需要的选择”时,
我很想用哲学的道理来反驳你,辩证唯物主义认识论认为真理的绝对性和相对性是辩证统一的,“当说什么是可能的时候,差不多总是对的;但当说什么是不可能的时候,他差不多总是错的。”
--------------------
不过我要是用这个来支持Sn肯定说服不了你
,只能用数理统计上的知识,在用样本数据估计总体中用到点估计,点估计的方法很多其中一个是矩估计法~用一阶样本原点距来估计总体均值,用二阶样本中心距来估计总体方差,而这个二阶样本中心距便是Sn
因此至少能说Sn能在2参数的矩估计中有不可忽视的作用
当然矩估计好不好那就是另一个话题了
作者: yaslygw    时间: 14-10-8 21:06
[f:16][f:19]看附件
作者: kai_wx    时间: 14-10-8 23:50
谢谢楼主花时间跟我探讨样本方差~开始用手机还没注意到,用电脑查看时发现楼主在回帖上挺用心的
作者: rocky84    时间: 14-10-9 07:23
谢谢楼主分享
作者: 苍州越    时间: 14-10-9 15:49
kankan 也想不明白
作者: Walrus623    时间: 14-10-9 17:18
来看看~正好不懂
作者: 天地人勇往直前    时间: 14-10-10 08:34
kai_wx 发表于 14-10-8 23:50
谢谢楼主花时间跟我探讨样本方差~开始用手机还没注意到,用电脑查看时发现楼主在回帖上挺用心的

[a:1][a:1][a:1][a:1][a:1][a:1]
作者: mm风铃草    时间: 14-10-12 17:02
笔为剑 发表于 14-10-4 22:18 那不是张厚粲的书,那是徐建平写的书,挂了张厚粲的名字而已。

是吗?张厚璨老师写的统计现在搜不到了是吗?怪不得我们学校的一老师(89年在北师大读心理学本科)说越读张老师的书越有味道,尤其是没有徐修订的.一直还在想,为什么当时的老师和现在的学生对张後璨老师的书评价那么不一致呢。
作者: 烟若2015    时间: 14-10-12 23:34
厉害~~~~~~~~~
作者: 笔为剑    时间: 14-10-12 23:34
mm风铃草 发表于 14-10-12 17:02
是吗?张厚璨老师写的统计现在搜不到了是吗?怪不得我们学校的一老师(89年在北师大读心理学本科)说越读张老 ...

张厚粲和孟庆茂合写的书才叫经典,好像是1983年还是1986年出版的,早就绝版了。我有幸收藏了一本。
哎呀呀呀,今天还跟张厚粲合影了,可是合影完了以后才发现照相的那个人我并不认识,而相机是他的。




作者: 风中回奏    时间: 14-10-25 23:01
晕啊,全忘啦
作者: 风中骄子    时间: 14-10-28 12:33
我觉得加一个的就好一些。一个是样本的方差,一个是样本方差。样本的标准差是不怎么用的,也没什么意义。而样本标准差是为了推断总体的。
作者: kakarott1990    时间: 14-10-28 16:36
不错,研究一下
作者: 醉茶茶    时间: 14-10-29 18:43
之前也对这个问题很困惑来着。后来是看胡竹菁的书。上面对样本统计量和总体参数的计算方式和代表字母都是一起专门介绍的。在标准差上有说道样本平均数的离均差平方和一般小于总体的,所以要用(n-1)。之后又将它当做自由度讲。即允许n-1项自由取值。就是标准差的分子上有n项离均差,但离均差之和为0,所以只有n-1项可以自由取值。我就是前面为啥用n-1明白了,但是后面的自由度又不明白了。离均差之和又不包含在n项离均差里,为啥它是0就得n-1了。
不过我对统计的理解还是靠这本书,对我来说好多困惑都解决了。不过这本书不全面,还要看张厚粲的。最好安排是先看这本,再补充看张的。
作者: 天地人勇往直前    时间: 14-10-29 20:08
风中骄子 发表于 14-10-28 12:33
我觉得加一个的就好一些。一个是样本的方差,一个是样本方差。样本的标准差是不怎么用的,也没什么意义。而 ...

额,我开始就是这么想的,但后来发现这是一厢情愿。某些教材比如张徐总是让人头晕。治标不治本,还是弄明白了本意好些。你这里说的“样本的标准差”,我开始的定义和你一样的,是张徐教材里面的概念,但我现在已经完全抛弃它了(就是个不该存在的东西)。
作者: 天地人勇往直前    时间: 14-10-29 20:17
醉茶茶 发表于 14-10-29 18:43
之前也对这个问题很困惑来着。后来是看胡竹菁的书。上面对样本统计量和总体参数的计算方式和代表字母都是一 ...

额,我没看那本书,也不知道为什么要说“因为离均差为0,所以n-1”。
我看的另一本教材里面说的“因为所以”让我更容易理解些。
大意就是M(平均数)是由X1,X2,X3,X4计算得来的。X123可自由变化,而在M,X123确定了之后,X4就不能自由变化了,被限制了。
即最初的N-1个数是可以自由变化的,但最后一个是被限制的,因此,样本的自由度为n-1。

(推测:自由变化就会引起变异,而方差不正是求的平均变异吗?那么在平均的时候/除以变异个数的时候,就应该是除以引起变异的“自由度”了)
作者: 醉茶茶    时间: 14-10-30 09:01
天地人勇往直前 发表于 14-10-29 20:17
额,我没看那本书,也不知道为什么要说“因为离均差为0,所以n-1”。
我看的另一本教材里面说的“因为所 ...

谢谢。明白了好多!加油考研,一定成功。
作者: 天地人勇往直前    时间: 14-10-30 10:40
醉茶茶 发表于 14-10-30 09:01
谢谢。明白了好多!加油考研,一定成功。

加油考研,大家都成功![a:14]
作者: 风中骄子    时间: 14-10-30 10:51
天地人勇往直前 发表于 14-10-29 20:08
额,我开始就是这么想的,但后来发现这是一厢情愿。某些教材比如张徐总是让人头晕。治标不治本,还是弄明 ...

建议看一下曹天啸的统计,他说的很明白。我觉得他虽然别的不怎么样。但统计我认为这个可以有,只有他讲的很清楚,他是按国外的体系讲的。就是这么分的。我以前看来5,6遍,才慢慢悟出来,刚开始真的很痛苦,真正明白真谛,发现其实就是那么样,但的确,真的明白不容易,如果真搞不懂,就一直用无偏好了,因为有偏基本不用。不过在标准误时又会迷糊了。有几个能明白中心极限定理,估计可能一些人都不熟悉,张的书其实说的也不清楚。很多她都认为你应该会了。直接就开始说了。
作者: 天地人勇往直前    时间: 14-10-31 08:25
本帖最后由 天地人勇往直前 于 14-10-31 08:31 编辑
风中骄子 发表于 14-10-30 10:51
建议看一下曹天啸的统计,他说的很明白。我觉得他虽然别的不怎么样。但统计我认为这个可以有,只有他讲的 ...


额,我觉得我已经基本明白了啊。
曹天啸的视频看过一点,气场蛮强的,正如你说的他对统计强点。另外还讲英语。
中心极限定理,百度了一下,确实很高深的样子。但看了定义,蛮好理解啊。

“中心极限定理:设从均值为μ、方差为σ^2;(有限)的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ^2/n 的正态分布。”

定理嘛,万有引力也是个定理,拿来用就好了。再说了,这是心理学统计,在心理学里面应用统计知识,又不是专门研究统计的,没必要研究到够深,能够理解运用就够了吧。

另外,查漏补缺多看几遍书,我觉得是应该的。但,看不懂,然后期望看一本书同样的内容多看几遍试图弄懂,这实在,不划算啊。哈哈,个人见解。

然后,标准误又怎么了?
哦对了,样本方差是估计总体的,其值为“(样本内各数据)离差平方和/自由度”。标准误是(很多个)样本平均数(组成的新分布)的标准差,其值为“总体标准差/根号下样本容量”,这里的总体标准差可以通过样本方差来估计。
就是因为把样本方差里面的n-1所代表的含义(无偏或自由度)没弄明白,所以才会在标准误这里的根号n带表的含义(样本容量)弄混


统计大都是符号,我认为学好“统计公式“的关键是弄清楚符号真正所表达的含义。而不是漫无目的的公式变形。
作者: 风中骄子    时间: 14-10-31 13:18
天地人勇往直前 发表于 14-10-31 08:25
额,我觉得我已经基本明白了啊。
曹天啸的视频看过一点,气场蛮强的,正如你说的他对统计强点。另外还 ...

标准误就是由中心极限定理来的。另外,老曹的英语就不建议看了。我去年听过他大部分课,当然,就从考试来说,不知道也无妨,能分清无偏,有偏就很不容易了。不过,从增加自身水平来说,能理解更好。还要提醒你的是有时样本即是总体。这时就是要做有偏估计了。虽然不经常出现,但要明白。相信楼主应该注意到了。
作者: 天地人勇往直前    时间: 14-10-31 15:36
风中骄子 发表于 14-10-31 13:18
标准误就是由中心极限定理来的。另外,老曹的英语就不建议看了。我去年听过他大部分课,当然,就从考试来 ...

这个,我还要说点什么吗,算了,我说了估计也不算个啥。
谢谢你的解释和提醒啊[d:27],考研加油![a:23]
作者: zulu9    时间: 14-11-8 13:10
晕,说啥呀~
作者: 天地人勇往直前    时间: 14-11-8 15:49
zulu9 发表于 14-11-8 13:10
晕,说啥呀~

这个。。。。[a:9]好吧。
我就是想通了一个让我迷糊纠结过的问题。
可能你没有这方面的问题吧,那当路过吧。
作者: 李温晓    时间: 14-11-21 20:25
bujianxin 发表于 14-10-3 18:49
国外那本书在细节方面写的很详细,对于看张厚粲书不明白的人是个好的备用书.
当时看的时候有一种豁然开朗 ...

张厚粲的书确实好像比较难,我看了胡竹菁主编的那本心理统计学感觉就简单点,章节的设计也更适合我自己,现在还在为统计头疼的小伙伴们可以尝试多看几本统计的书
作者: 2016考研神    时间: 15-1-25 17:38
谢谢 ,谢谢




欢迎光临 Free考研资料 (http://bbs.freekaoyan.com/) Powered by Discuz! X3.2