虚拟变量怎么做回归,虚拟变量怎么做回归eviews

虚拟变量怎么做回归,虚拟变量怎么做回归eviews插图

在大多数情况下,变量关系研究是问卷研究的核心。变量关系研究包括相关分析、线性回归分析、中介功能分析、调整功能分析等,如果变量Y值为分类数据,则涉及Logistic回归分析。相关分析是研究两个变量之间的相关关系,线性回归分析或者Logistic回归分析是影响关系的研究,区别在于线性回归分析的变量Y值是定量数据,Logistic回归因变量Y值的分析是分类数据。研究中介功能或调整功能是对关系的更深入的研究和分析,将在后面的文章中介绍。本文重点关注相关分析回归分析回答常见问题。

虚拟变量怎么做回归,虚拟变量怎么做回归eviews插图1

关系与回归的区别

相关分析和回归分析既有联系又有区别。下面详细说明。

相关分析:研究是否相关,关系强度如何。

回归分析:研究影响关系、影响关系和影响关系。

相关分析是研究是否有关系,回归分析是研究影响关系。显然,相关分析是基础,然后进行回归分析。首先,我们需要知道是否有相关关系;只有相关关系,才能有回归影响关系;如果没有相关关系,就不应该有回归影响关系。因此,从分析的角度来看,在进行回归分析之前,应首先进行相关分析。

有时会出现奇怪的现象,如:

有回归影响关系,但没有相关关系此时建议以无关系为结论

负面影响关系,但正面影响关系建议以相关关系但未回归影响关系为结论

回归分析常见问题

1)缺乏回归分析Y

回归分析是研究X对Y的影响。有时由于问卷设计问题,直接缺乏Y,建议考虑总结X所有问题的计算平均值Y。(SPSSAU用户使用生成变量的平均功能)

另一个提示:如果问卷中没有设计Y对应的问题,则没有其他方法可以处理

2)是否需要分析散点图?

散点图可以直观地显示两个变量之间的关系,通常需要先分析散点图,然后分析相关关系,然后进行回归分析。

3)应选择相关分析Pearson还是Spearman

相关系数分为两种,分别是Pearson相关系数和Spearman相关系数。绝大多数情况下使用。Pearson相关系数,默认使用软件Pearson相关系数。如果发现研究变量严重,则不会正态分布,此时使用Spearman相关系数比较合适。

4)相关分析结果与线性回归分析结果相矛盾?

如果相关分析结果与线性回归分析相矛盾,如无关,则表现出明显的回归影响关系。或者变量之间存在明显的正相关性,但存在负回归影响关系。此时,应以相关分析结论为准。这些问题的原因可能是Suppressor
effect(抑制效应)。

5)作为分类数据自变量如何进行回归分析?

如果要将分类数据作为自变量放入模型,则应首先对分类数据进行分类虚拟变量然后放入模型中,虚拟变量处理可参考5.2.8部分。

6)分类数据作为变量的分析方法。

如果将数据分类为因变量,此时应使用Logistic回归分析,具体Logistic回归分析的类别选择可参考10.2.4部分。

7)回归分析失败F检验,但回归系数呈现显著性。

如果回归分析没有通过F检验,这表明所有自变量X不应影响变量Y,即研究模型毫无意义。此时,即使回归系数显著,也应以F检测结果为准,即自变量X不会影响变量Y。

8)回归分析时VIF值高于10

如果VIF当模型结论不可信时,值高于10表明存在严重的多线性问题。对于多线性问题,最好的处理方法是分析问题的探索性因素,并利用探索性因素分析获得的因素得分进行回归分析。此外,还可以对自变量进行相关分析,找出关系最密切的研究变量,并将其移出回归分析进行重新分析。

9)在回归分析时,某个变量并不显著,但理论上肯定应该显著确认。

如果一个研究变量在回归分析时没有显著,但理论上应该显著。此时,可以考虑筛选样本,并将样本的个人背景信息添加到控制变量的模型中进行重新分析。

10R平方值很小,低于0.4

R平方值表示模型的解释强度,即模型拟合度,在0~1之间,值越大,模型拟合度越高,通常越大越好。在实际研究中,该指标的意义相对较小,即使该指标小于0.4。我们应该关注自变量X和因变量Y之间的回归关系,即自变量是否显著。

11)调整R平方值为负。

R平方值的调整可以是负数,如果出现负数,R平方值通常很小,接近0,模型基本没有意义。

12)控制变量有什么用?

控制变量本质上是自变量,但通常这种变量不是研究核心变量,可能会干扰模型,因此也需要将其放入模型中,称为控制变量。性别、学历、年龄、收入等基本背景信息问题通常控制变量。将控制变量放入回归模型,以防止这些变量干扰研究。通常情况下,控制变量是分类数据,如性别和学历,所以在大多数情况下,控制变量需要虚拟变量。

13)探索性因素分析保存得分能否作为自变量?

如果一个研究变量对应于多个问题,通常的方法是计算多个问题的平均值,并以平均值代表整个研究变量。如果探索因素分析和保存因素分析的研究变量,也可以使用因素分数代表相应的研究变量进行相关或回归分析。

14Hosmer
and Lemeshow
检验对应P值小于0.05

进行二元Logistic如果回归分析Hosmer
and
LemeshowP值小于0.05意味着模型拟合与实际情况有很大的不同,模型并不理想。您可以考虑重新组合自变量数据,或测试因变量数据重新组合而找到最佳结果。

15)总体预测精度低于70%

如果二元Logistic回归分析显示,当整体预测精度低于70%时,说明模型整体情况不佳。可以考虑重组自变量,也可以删除个别无意义自变量,比较各种处理,找出最佳结果。

16)输出结果中的一项未显示P值。

如果二元Logistic如果回归分析中有分类数据,模型将以某一项为参考对比项,参考对比项不会输出P值等指标。

**本论坛部分作品是由网友自主投稿和发布、编辑整理上传,对此类作品本论坛仅供提供学习交流和参考,禁止用户用于商业行为,并请于下载后24小时内删除,若喜欢该作品请联系原作者购买正版。如果您发现论坛上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。
158自学网 » 虚拟变量怎么做回归,虚拟变量怎么做回归eviews
关于售后:
(1)、因部分资料含有敏感关键词,百度网盘无法分享链接,请联系客服进行发送;
(2)、所有资料在您未收到之前,都可以联系微信/QQ:406499404,无条件退款
(3)仅支持原渠道退回,微信支付,支付宝退回至您当初选择的付款方式
(4)不用担心不给资料,如果没有及时回复也不用担心,看到了都会发给您的,请放心!
(5)因部份资源来源互联网,本站不担保其完整性,请知悉!

提供最优质的资源集合

立即查看 了解详情
赞助VIP 享更多特权,建议使用 QQ 登录
喜欢我嘛?关注我们的公众号吧!♡