Free考研资料

标题: 多元线性回归中的数据转换 [打印本页]

作者: zhenreal    时间: 14-10-4 19:02
标题: 多元线性回归中的数据转换
    本人研究预使用SPSS回归分析验证,高期待、高批评以及二者的交互作用(高期待*高批评)能够预测抑郁这一模型。但是效标变量(抑郁)为偏态分布(spss运行结果也为残差不符合正态分布)。这种情况下还能否使用线性回归?(样本容量642,不打算再增加样本量)


1.如果想使用该如何将变量做转换?(是将抑郁做正态性转换么?SPSS该如何操作呢?)


2.看到国外相关研究文献中将所有预测变量围绕均值中心化,效标变量做了非线性转换。实在不明觉厉,这个转化不是改变非正态么?怎么成线性了?

“All predictor variables were centered (around the mean) for the regression analyses presented below. As depression was not normally distributed, a nonlinear transformation was used (i.e., square root), which reduced both skew (2.84) and kurtosis(7.80).”
      
3.我想以效标变量为Y轴,做交互作用回归曲线,各位大神有谁知道如何用SPSS实现么?

研究新手,摸索阶段,还望哪位统计高手不吝赐教,知无不言,事无巨细。不胜感激!!!在线等,挺急的,赏考元!!!
作者: layman    时间: 14-10-18 15:40
As depression was not normally distributed, a nonlinear transformation was used (i.e., square root), which reduced both skew (2.84) and kurtosis(7.80).”

这句话的意思不就是用了一种方法,解决了不正态的问题
作者: layman    时间: 14-10-18 15:41
1. 说不清,百度或者google查。。。。
作者: layman    时间: 14-10-18 15:46
如果抑郁可以按照某些标准分类,是否可以用logistic回归呢?

3. 不知道。。。知道了麻烦告诉我怎么做
作者: seeya9    时间: 14-10-18 15:59
本帖最后由 seeya9 于 14-10-18 16:07 编辑

1. 我们处理的也是病人数据;有很多天花板和地板;但是没有一个reviewer argue过这一点(可能大家都知道肯定是偏态的),也没有被要求过做正态化。一个彻底的解决方法是使用一些非参的办法。但实际上我们还是做了线性回归;似乎不是一个问题。但是做变换强行变成正态;感觉很tricky,至今也就看过一次两次的(可能是脑的文章大家不太在乎这个)
2.这句话说了用开平方的方法进行变换,降低了偏态的程度。开平方就是一种非线性变换(注意正态和线性与否没有关系)
作者: zhenreal    时间: 14-10-21 17:03
本帖最后由 zhenreal 于 14-10-21 17:11 编辑
seeya9 发表于 14-10-18 15:59
1. 我们处理的也是病人数据;有很多天花板和地板;但是没有一个reviewer argue过这一点(可能大家都知道肯 ...


首先,谢谢亲帮我解答,激动之情溢于言表(让我平静下先)我已经要死要活了将近一礼拜了,一些实际操作问题通过百度Google已解决。我也是发现了国外做临床类被试或者偏态数据一句话不说就直线上线性回归让我疑惑不已。我根据文献的方法做了中心化和正态化转化,反而使我的数据线性关系模糊了,但是曲线拟合的也不咋地。我决定就不纠结了,直接上线性回归了!(握拳)
最后,我私信你一图片吧,亲帮我看看这图国外大佬们是咋整的?
作者: zhenreal    时间: 14-10-21 17:05
layman 发表于 14-10-18 15:40
As depression was not normally distributed, a nonlinear transformation was used (i.e., square root), ...

对哒!但我发现转化完反而数据线性关系弱没了……




欢迎光临 Free考研资料 (http://tool.freekaoyan.com/) Powered by Discuz! X3.2