学曲谱,请上曲谱自学网!

logistic回归

时间:2020-02-09 23:34:00编辑:刘牛来源:曲谱自学网

曲谱自学网今天精心准备的是《logistic回归》,下面是详解!

如何用spss做logistic回归

  Logistic回归主要分为三类,一种是因变量为二分类得logistic回归,这种回归叫做二项logistic回归,一种是因变量为无序多分类得logistic回归,比如倾向于选择哪种产品,这种回归叫做多项logistic回归。还有一种是因变量为有序多分类的logistic回归,比如病重的程度是高,中,低呀等等,这种回归也叫累积logistic回归,或者序次logistic回归。

  二值logistic回归:

  选择分析——回归——二元logistic,打开主面板,因变量勾选你的二分类变量,这个没有什么疑问,然后看下边写着一个协变量。有没有很奇怪什么叫做协变量?在二元logistic回归里边可以认为协变量类似于自变量,或者就是自变量。把你的自变量选到协变量的框框里边。

  细心的朋友会发现,在指向协变量的那个箭头下边,还有一个小小的按钮,标着a*b,这个按钮的作用是用来选择交互项的。我们知道,有时候两个变量合在一起会产生新的效应,比如年龄和结婚次数综合在一起,会对健康程度有一个新的影响,这时候,我们就认为两者有交互效应。那么我们为了模型的准确,就把这个交互效应也选到模型里去。我们在右边的那个框框里选择变量a,按住ctrl,在选择变量b,那么我们就同时选住这两个变量了,然后点那个a*b的按钮,这样,一个新的名字很长的变量就出现在协变量的框框里了,就是我们的交互作用的变量。

  然后在下边有一个方法的下拉菜单。默认的是进入,就是强迫所有选择的变量都进入到模型里边。除去进入法以外,还有三种向前法,三种向后法。一般默认进入就可以了,如果做出来的模型有变量的p值不合格,就用其他方法在做。再下边的选择变量则是用来选择你的个案的。一般也不用管它。

  选好主面板以后,单击分类(右上角),打开分类对话框。在这个对话框里边,左边的协变量的框框里边有你选好的自变量,右边写着分类协变量的框框则是空白的。你要把协变量里边的字符型变量和分类变量选到分类协变量里边去(系统会自动生成哑变量来方便分析,什么事哑变量具体参照前文)。这里的字符型变量指的是用值标签标注过得变量,不然光文字,系统也没法给你分析啊。选好以后,分类协变量下边还有一个更改对比的框框,我们知道,对于分类变量,spss需要有一个参照,每个分类都通过和这个参照进行比较来得到结果,更改对比这个框框就是用来选择参照的。默认的对比是指示符,也就是每个分类都和总体进行比较,除了指示符以外还有简单,差值等。这个框框不是很重要,默认就可以了。

  点击继续。然后打开保存对话框,勾选概率,组成员,包含协方差矩阵。点击继续,打开选项对话框,勾选分类图,估计值的相关性,迭代历史,exp(B)的CI,在模型中包含常数,输出——在每个步骤中。如果你的协变量有连续型的,或者小样本,那还要勾选Hosmer-Lemeshow拟合度,这个拟合度表现的会较好一些。

  继续,确定。

  然后,就会输出结果了。主要会输出六个表。

  第一个表是模型系数综合检验表,要看他模型的p值是不是小于0.05,判断我们这个logistic回归方程有没有意义。

  第二个表示模型汇总表。这个表里有两个R^2,叫做广义决定系数,也叫伪R^2,作用类似于线性回归里的决定系数,也是表示这个方程能够解释模型的百分之多少。由于计算方法不同,这两个广义决定系数的值往往不一样,但是出入并不会很大。

  在下边的分类表则表述了模型的稳定性。这个表最后一行百分比校正下边的三个数据列出来在实际值为0或者1时,模型预测正确的百分比,以及模型总的预测正确率。一般认为预测正确概率达到百分之五十就是良好(标准真够低的),当然正确率越高越好。

  在然后就是最重要的表了,方程中的变量表。第一行那个B下边是每个变量的系数。第五行的p值会告诉你每个变量是否适合留在方程里。如果有某个变量不适合,那就要从新去掉这个变量做回归。根据这个表就可以写出logistic方程了:P=Exp(常量+a1*变量1+a2*变量2.。。。)/(1+Exp(常量+a1*变量1+a2*变量2.。。。))。如果大家学过一点统计,那就应该对这个形式的方程不陌生。提供变量,它最后算出来会是一个介于0和1的数,也就是你的模型里设定的值比较大的情况发生的概率,比如你想推算会不会治愈,你设0治愈,1为没有治愈。那你的模型算出来就是没有治愈的概率。如果你想直接计算治愈的概率,那就需要更改一下设定,用1去代表治愈。

  此外倒数后两列有一个EXP(B),也就是OR值,哦,这个可不是或者的意思,OR值是优势比。在线性回归里边我们用标准化系数来对比两个自变量对于因变量的影响力的强弱,在logistic回归里边我们用优势比来比较不同的情况对于因变量的影响。举个例子。比如我想看性别对于某种病是否好转的影响,假设0代表女,1代表男,0代表不好转,1代表好转。发现这个变量的OR值为2.9,那么也就是说男人的好转的可能是女人好转的2.9倍。注意,这里都是以数值较大的那个情况为基准的。而且OR值可以直接给出这个倍数。如果是0,1,2各代表一类情况的时候,那就是2是1的2.9倍,1是0的2.9倍,以此类推。OR值对于方程没什么贡献,但是有助于直观的理解模型。在使用OR值得时候一定要结合它95%的置信区间来进行判断。

  此外还有相关矩阵表和概率直方图,就不再介绍了。

  

  

  

  多项logistic回归:

  选择分析——回归——多项logistic,打开主面板,因变量大家都知道选什么,因变量下边有一个参考类别,默认的第一类别就可以。再然后出现了两个框框,因子和协变量。很明显,这两个框框都是要你选因变量的,那么到底有什么区别呢?嘿嘿,区别就在于,因子里边放的是无序的分类变量,比如性别,职业什么的,以及连续变量(实际上做logistic回归时大部分自变量都是分类变量,连续变量是比较少的。),而协变量里边放的是等级资料,比如病情的严重程度啊,年龄啊(以十年为一个年龄段撒,一年一个的话就看成连续变量吧还是)之类的。在二项logistic回归里边,系统会自动生成哑变量,可是在多项logistic回归里边,就要自己手动设置了。参照上边的解释,不难知道设置好的哑变量要放到因子那个框框里去。

  然后点开模型那个对话框,哇,好恐怖的一个对话框,都不知道是干嘛的。好,我们一点点来看。上边我们已经说过交互作用是干嘛的了,那么不难理解,主效应就是变量本身对模型的影响。明确了这一点以后,这个对话框就没有那么难选了。指定模型那一栏有三个模型,主效应指的是只做自变量和因变量的方程,就是最普通的那种。全因子指的是包含了所有主效应和所有因子和因子的交互效应的模型(我也不明白为什么只有全因子,没有全协变量。这个问题真的很难,所以别扩展我啦。)第三个是设定/步进式。这个是自己手动设置交互项和主效应项的,而且还可以设置这个项是强制输入的还是逐步进入的。这个概念就不用再啰嗦了吧啊?

  点击继续,打开统计量对话框,勾选个案处理摘要,伪R方,步骤摘要,模型拟合度信息,单元格可能性,分类表,拟合度,估计,似然比检验,继续。打开条件,全勾,继续,打开选项,勾选为分级强制条目和移除项目。打开保存,勾选包含协方差矩阵。确定(总算选完了)。

  结果和二项logistic回归差不多,就是多了一个似然比检验,p值小于0.05认为变量有意义。然后我们直接看参数估计表。假设我们的因变量有n个类,那参数估计表会给出n-1组的截距,变量1,变量2。我们我们用Zm代表Exp(常量m+am1*变量1+am2*变量2+。。。),那么就有第m类情况发生的概率为Zn/1+Z2+Z3+……+Zn(如果我们以第一类为参考类别的话,我们就不会有关于第一类的参数,那么第一类就是默认的1,也就是说Z1为1)。

  

  有序回归(累积logistic回归):

  选择菜单分析——回归——有序,打开主面板。因变量,因子,协变量如何选取就不在重复了。选项对话框默认。打开输出对话框,勾选拟合度统计,摘要统计,参数估计,平行线检验,估计响应概率,实际类别概率,确定,位置对话框和上文的模型对话框类似,也不重复了。确定。

  结果里边特有的一个表是平行线检验表。这个表的p值小于0.05则认为斜率系数对于不同的类别是不一样的。此外参数估计表得出的参数也有所不同。假设我们的因变量有四个水平,自变量有两个,那么参数估计表会给出三个阈值a1,a2,a3(也就是截距),两个自变量的参数m,n。计算方程时,首先算三个Link值,Link1=a1+m*x1+n*x2,Link2=a2+m*x1+n*x2,Link3=a3+m*x1+n*x2,(仅有截距不同)有了link值以后,p1=1/(1+exp(link1)),p1+p2=1/(1+exp(link2)),p1+p2+p3=1/(1+exp(link3)),p1+p2+p3+p4=1..

  通过上边的这几个方程就能计算出各自的概率了。

  

  Logistic回归到这里基本就已经结束了。大家一定要记熟公式,弄混可就糟糕了。希望能对你有所帮助呦。

多元回归分析与logistic回归的分析的区别和联系

1、概念不同:
(1)多重线性回归模型可视为简单直线模型的直接推广,具有两个及两个以上自变量的线性模型即为多重线性回归模型。
(2)logistic属于概率型非线性回归,是研究二分类(可扩展到多分类)观察结果与一些影响因素之间关系的一种多变量分析方法。
2、变量的特点
多元回归分析的应变量:1个;数值变量(正态分布);自变量:2个及2个以上;最好是数值变量,也可以是无序分类变量、有序变量。
logistic回归的分析应变量:1个;二分 类变量(二项分布)、无序 /有序多分类变量;自变量:2个及2个以上;数值变量、二分类变量、无序/有序多分类变量。
总体回归模型LogitP=(样本)偏回归系数含义表示在控制其它因素或说扣除其它因素的作用后(其它所有自变量固定不变的情况下),某一个自变量变化一个单位时引起因变量Y变化的平均大小。
表示在控制其它因素或说扣除其它因素的作用后(其它所有自变量固定不变的情况下),某一因素改变一个单位时,效应指标发生与不发生事件的概率之比的对数变化值(logitP的平均变化量),即lnOR。
3、适用条件LINE:
1、L:线性——自变量X与应变量Y之间存在线性关系;
2、I:独立性——Y值相互独立,在模型中则要求残差相互独立,不存在自相关;
3、N:正态性——随机误差(即残差)e服从均值为零,方差为 2的正态分布;
4、E:等方差——对于所有的自变量X,残差e的方差齐。
观察对象(case)之间相互独立;若有数值变量,应接近正态分布(不能严重偏离正态分布);二分类变量服从二项分布;要有足够的样本量;LogitP与自变量呈线性关系。

如何在spss进行logistic单因素回归分析

1、打开spss统计软件,然后单击“Analyze  -  Regression  -  Binary Logistic”。

2、出现“逻辑回归”窗口。将“高血压”放入“依赖变量”框,并将其他变量(如“性别”和“体重指数”)放入“分隔符”框中。

3、单击“分类”将分类变量的自变量放入右侧的“分类协变量”框中。在这种情况下,自变量“性别”,“饮食习惯,体育锻炼”是分类变量。在右侧的框中选择变量。 “参考类别”选择“最后”或“第一”,此处选择默认的“最后”。点击“继续”。

4、单击“保存”,选中“概率”,“组成员”,然后“继续”。

5、点击“选项”,勾选“Hosmer-Lymeshaw Fitting Goodness”和“95%Confidence Interval”,然后点击“Continue”。

6、方法“选择”输入“最后”确定“。

logistic回归是不是要求自变量符合正态分布??

没有这个要求。

logistic回归只要求自变量和Logistic概率是线性关系。

Logistic回归实质是发生概率除以没有发生概率再取对数。就是这个不太繁琐的变换改变了取值区间的矛盾和因变量自变量间的曲线关系。究其原因,是发生和未发生的概率成为了比值 ,这个比值就是一个缓冲,将取值范围扩大,再进行对数变换,整个因变量改变。

不仅如此,这种变换往往使得因变量和自变量之间呈线性关系,这是根据大量实践而总结。所以,Logistic回归从根本上解决因变量要不是连续变量怎么办的问题。还有,Logistic应用广泛的原因是许多现实问题跟它的模型吻合。例如一件事情是否发生跟其他数值型自变量的关系。

扩展资料:

主要用途

1、寻找危险因素

正如上面所说的寻找某一疾病的危险因素等。

2、预测

如果已经建立了logistic回归模型,则可以根据模型,预测在不同的自变量情况下,发生某病或某种情况的概率有多大。

3、判别

实际上跟预测有些类似,也是根据logistic模型,判断某人属于某病或属于某种情况的概率有多大,也就是看一下这个人有多大的可能性是属于某病。

这是logistic回归最常用的三个用途,实际中的logistic回归用途是极为广泛的,logistic回归几乎已经成了流行病学和医学中最常用的分析方法,因为它与多重线性回归相比有很多的优势,以后会对该方法进行详细的阐述。实际上有很多其他分类方法,只不过Logistic回归是最成功也是应用最广的。              

参考资料来源:百度百科-logistic回归    

probit回归与logistic回归有什么区别

probit与logistic的区别为:意思不同、用法不同、侧重点不同。

一、意思不同

1、probit:概率单位。

2、logistic:数理(符号)逻辑。

二、用法不同

1、probit:

probit模型服从正态分布。两个模型都是离散选择模型的常用模型。但logit模型简单直接,应用更广。而且,当因变量是名义变量时,Logit和Probit没有本质的区别,一般情况下可以换用。区别在于采用的分布函数不同,前者假设随机变量服从逻辑概率分布,而后者假设随机变量服从正态分布。

2、logistic:Logit模型是最早的离散选择模型,也是目前应用最广的模型。Logit模型是Luce(1959)根据IIA特性首次导出的;Marschark(1960)证明了Logit模型与最大效用理论的一致性;Marley(1965)研究了模型的形式和效用非确定项的分布之间的关系。

三、侧重点不同

1、probit:根据常态频率分配平均数的偏差计算统计单位。

2、logistic:离散选择法模型之一,Logit模型是最早的离散选择模型。

Logistic回归分析指标重要程度的主要过程是什么?

Logistic回归:实际上属于判别分析,因拥有很差的判别效率而不常用。
1. 应用范围:
① 适用于流行病学资料的危险因素分析
② 实验室中药物的剂量-反应关系
③ 临床试验评价
④ 疾病的预后因素分析
2. Logistic回归的分类:
① 按因变量的资料类型分:
二分类
多分类
其中二分较为常用
② 按研究方法分:
条 件Logistic回归
非条件Logistic回归
两者针对的资料类型不一样,后者针对成组研究,前者针对配对或配伍研究。
3.Logistic回归的应用条件是:
① 独立性。各观测对象间是相互独立的;
② LogitP与自变量是线性关系;
③ 样本量。经验值是病例对照各50例以上或为自变量的5-10倍(以10倍为宜),不过随着统计技术和软件的发展,样本量较小或不能进行似然估计的情况下可采用精确logistic回归分析,此时要求分析变量不能太多,且变量分类不能太多;
④ 当队列资料进行logistic回归分析时,观察时间应该相同,否则需考虑观察时间的影响(建议用Poisson回归)。
4. 拟和logistic回归方程的步骤:
① 对每一个变量进行量化,并进行单因素分析;
② 数据的离散化,对于连续性变量在分析过程中常常需要进行离散变成等级资料。可采用的方法有依据经验进行离散,或是按照四分、五分位数法来确定等级,也可采用聚类方法将计量资料聚为二类或多类,变为离散变量。
③ 对性质相近的一些自变量进行部分多因素分析,并探讨各自变量(等级变量,数值变量)纳入模型时的适宜尺度,及对自变量进行必要的变量变换;
④ 在单变量分析和相关自变量分析的基础上,对P≤α(常取0.2,0.15或0.3)的变量,以及专业上认为重要的变量进行多因素的逐步筛选;模型程序每拟合一个模型将给出多个指标值,供用户判断模型优劣和筛选变量。可以采用双向筛选技术:a进入变量的筛选用score统计量或G统计量或LRS(似然比统计量),用户确定P值临界值如:0.05、0.1或0.2,选择统计量显著且最大的变量进入模型;b剔除变量的选择用Z统计量(Wald统计量),用户确定其P值显著性水平,当变量不显者,从模型中予以剔除。这样,选入和剔除反复循环,直至无变量选入,也无变量删除为止,选入或剔除的显著界值的确定要依具体的问题和变量的多寡而定,一般地,当纳入模型的变量偏多,可提高选入界值或降低剔除标准,反之,则降低选入界值、提高删除标准。但筛选标准的不同会影响分析结果,这在与他人结果比较时应当注意。
⑤ 在多因素筛选模型的基础上,考虑有无必要纳入变量的交互作用项;两变量间的交互作用为一级交互作用,可推广到二级或多级交互作用,但在实际应用中,各变量最好相互独立(也是模型本身的要求),不必研究交互作用,最多是研究少量的一级交互作用。
⑥ 对专业上认为重要但未选入回归方程的要查明原因。
5. 回归方程拟合优劣的判断(为线性回归方程判断依据,可用于logistic回归分析)
① 决定系数(R2)和校正决定系数( ),可以用来评价回归方程的优劣。R2随着自变量个数的增加而增加,所以需要校正;校正决定系数( )越大,方程越优。但亦有研究指出R2是多元线性回归中经常用到的一个指标,表示的是因变量的变动中由模型中自变量所解释的百分比,并不涉及预测值与观测值之间差别的问题,因此在logistic回归中不适合。
② Cp选择法:选择Cp最接近p或p+1的方程(不同学者解释不同)。Cp无法用SPSS直接计算,可能需要手工。1964年CL Mallows提出:

Cp接近(p+1)的模型为最佳,其中p为方程中自变量的个数,m为自变量总个数。
③ AIC准则:1973年由日本学者赤池提出AIC计算准则,AIC越小拟合的方程越好。

在logistic回归中,评价模型拟合优度的指标主要有Pearson χ2、偏差(deviance)、Hosmer- Lemeshow (HL)指标、Akaike信息准则(AIC)、SC指标等。Pearson χ2、偏差(deviance)主要用于自变量不多且为分类变量的情况,当自变量增多且含有连续型变量时,用HL指标则更为恰当。Pearson χ2、偏差(deviance)、Hosmer- Lemeshow (HL)指标值均服从χ2分布,χ2检验无统计学意义(P>0.05)表示模型拟合的较好,χ2检验有统计学意义(P≤0.05)则表示模型拟合的较差。AIC和SC指标还可用于比较模型的优劣,当拟合多个模型时,可以将不同模型按其AIC和SC指标值排序,AIC和SC值较小者一般认为拟合得更好。
6. 拟合方程的注意事项:
① 进行方程拟合对自变量筛选采用逐步选择法[前进法(forward)、后退法(backward)、逐步回归法(stepwise)]时,引入变量的检验水准要小于或等于剔除变量的检验水准;
② 小样本检验水准α定为0.10或0.15,大样本把α定为0.05。值越小说明自变量选取的标准越严;
③ 在逐步回归的时可根据需要放宽或限制进入方程的标准,或硬性将最感兴趣的研究变量选入方程;
④ 强影响点记录的选择:从理论上讲,每一个样本点对回归模型的影响应该是同等的,实际并非如此。有些样本点(记录)对回归模型影响很大。对由过失或错误造成的点应删去,没有错误的强影响点可能和自变量与应变量的相关有关,不可轻易删除。
⑤ 多重共线性的诊断(SPSS中的指标):a容许度:越近似于0,共线性越强;b特征根:越近似于0,共线性越强;c条件指数:越大,共线性越强;
⑥ 异常点的检查:主要包括特异点(outher)、高杠杆点(high leverage points)以及强影响点(influential points)。特异点是指残差较其他各点大得多的点;高杠杆点是指距离其他样品较远的点;强影响点是指对模型有较大影响的点,模型中包含该点与不包含该点会使求得的回归系数相差很大。单独的特异点或高杠杆点不一定会影响回归系数的估计,但如果既是特异点又是高杠杆点则很可能是一个影响回归方程的“有害”点。对特异点、高杠杆点、强影响点诊断的指标有Pearson残差、Deviance残差、杠杆度统计量H(hat matrix diagnosis)、Cook 距离、DFBETA、Score检验统计量等。这五个指标中,Pearson残差、Deviance残差可用来检查特异点,如果某观测值的残差值>2,则可认为是一个特异点。杠杆度统计量H可用来发现高杠杆点, H值大的样品说明距离其他样品较远,可认为是一个高杠杆点。Cook 距离、DFBETA指标可用来度量特异点或高杠杆点对回归模型的影响程度。Cook距离是标准化残差和杠杆度两者的合成指标,其值越大,表明所对应的观测值的影响越大。DFBETA指标值反映了某个样品被删除后logistic回归系数的变化,变化越大(即DFBETA指标值越大),表明该观测值的影响越大。如果模型中检查出有特异点、高杠杆点或强影响点,首先应根据专业知识、数据收集的情况,分析其产生原因后酌情处理。如来自测量或记录错误,应剔除或校正,否则处置就必须持慎重态度,考虑是否采用新的模型,而不能只是简单地删除就算完事。因为在许多场合,异常点的出现恰好是我们探测某些事先不清楚的或许更为重要因素的线索。
7. 回归系数符号反常与主要变量选不进方程的原因:
① 存在多元共线性;
② 有重要影响的因素未包括在内;
③ 某些变量个体间的差异很大;
④ 样本内突出点上数据误差大;
⑤ 变量的变化范围较小;
⑥ 样本数太少。
8. 参数意义
① Logistic回归中的常数项(b0)表示,在不接触任何潜在危险/保护因素条件下,效应指标发生与不发生事件的概率之比的对数值。
② Logistic回归中的回归系数(bi)表示,其它所有自变量固定不变,某一因素改变一个单位时,效应指标发生与不发生事件的概率之比的对数变化值,即OR或RR的对数值。需要指出的是,回归系数β的大小并不反映变量对疾病发生的重要性,那么哪种因素对模型贡献最大即与疾病
扩展:
联系最强呢? (InL(t-1)-InL(t))三种方法结果基本一致。
③ 存在因素间交互作用时,Logistic回归系数的解释变得更为复杂,应特别小心。
④ 模型估计出OR,当发病率较低时,OR≈RR,因此发病率高的疾病资料不适合使用该模型。另外,Logistic模型不能利用随访研究中的时间信息,不考虑发病时间上的差异,因而只适于随访期较短的资料,否则随着随访期的延长,回归系数变得不稳定,标准误增加。
9. 统计软件
能够进行logistic回归分析的软件非常多,常用的有SPSS、SAS、Stata、EGRET (Epidemiological Graphics Estimation and Testing Package)等。

求问spss20.0 logistic回归分析步骤

想知道具体的操作步骤,分别需要进行哪几个检验,如果检验不合格怎么解释,文科生真的给跪了...

想知道具体的操作步骤,分别需要进行哪几个检验,如果检验不合格怎么解释,文科生真的给跪了

SPss中logistic回归交互作用

看到百度上你对交互作用的回答,很崇拜,有个问题想请教你。在SPSSlogistic回归中,我要分析A和B两个因素的交互作用(相乘),我把A,B同时选中,点“a*b”进入covariates,那还需要把...

看到百度上你对交互作用的回答,很崇拜,有个问题想请教你。在SPSS logistic回归中,我要分析A和B 两个因素的交互作用(相乘),我把A,B 同时选中,点“a*b”进入covariates,那还需要把A和B 单独拉入covariates吗? 展开

把A,B 同时选中,点“a*b”进入covariates后就可以得到A与B 的交互作用结果了,不管你是否将A和B 单独拉入covariates。不过,正常情况下都会将A和B 单独拉入以便分别考察A和B的单独效应。最后,你最好还要点击主界面的Categorical按钮,将A和B 选入,这样才能在输出的结果中清晰地看到各项交互作用的结果。

更多扩展补充

扩展

谢谢你的回答,对我很有帮助,我按照你的说法把A,B,A*B都拉入covariates,结果得出:
A因素:β=0.508,p=0.002,OR(95%)=1.66(1.21-2.28)
B因素:β=0.326,p=0.005,OR(95%)=1.39(1.10-1.74)
A*B交互:β= -0.641,p=0.013,OR(95%)=0.53(0.32-0.87)
为什么单独的A或B 都是危险因素(OR>1),交互之后就变成了保护因素呢(OR<1)?

补充

这是正常现象。交互作用可以出现正交互作用,也可以出现负交互作用。从减少发病率这个角度,你的结果是出现了负交互作用。需要注意的是,统计模型仅仅提示你负交互作用可能性的存在,你还需要结合专业知识来探讨这种可能性是否有可能存在,因果关系的建立不能仅仅依靠统计模型,而是主要依据专业知识。

扩展

谢谢你的回答。我还有一个问题想请教你。我在分析A基因型对疾病的影响时,发现在两个独立人群中,A基因型均为危险因素,OR值分别为:1.98和1.27。由于BMI是影响疾病的一个因素,因此我以BMI25为界进行了分层分析,结果发现在两个人群中,A基因型在BMI>25的群体中均无意义(P>0.05),而在BMI<25的群体中均为危险因素,但是OR值差别比较大(3.58 vs1.65),为什么会出现这么大的差别呢?谢谢!

补充

你的这种情况有可能说明BMI>25的群体中携有A基因型对疾病的影响不大,而A基因有可能只对BMI<25的群体为危险因素。你的“OR值差别比较大(3.58 vs1.65)”没有说清楚那个值属于谁,不好判断。不过,从你提供的OR值来看,数值都不算大,有可能表明与疾病的联系强度不算大(即使你的P值小于0.05,尤其是在大样本量时更是如此),这个判断是基于你正确使用了OR值。OR值只应用于病例对照研究,并且发病率不能高于10%,此时OR值可以近似RR值,否则不好解释它的意义。如果是队列研究,应该使用RR值。此外,还要考虑样本量,这一点对结果解释也十分重要!

来自:求助得到的回答

SPSS 多因素非条件logistic回归分析 中的SE 、B 、...

我已经知道OR和95%CI是比值比和95%可信区间的意思,那么上面那几个是什么意思啊?求解释,包含不同的数值是什么意思,怎么解读...

我已经知道OR 和95%CI是比值比和95%可信区间的意思,那么上面那几个是什么意思啊?求解释,包含不同的数值是什么意思,怎么解读

SPSS多因素非条件logistic回归分析中:SE表示标准误、B表示回归系数、R表示拟合优度指标、P表示:P>1是危险因素、P<1保护因素、P=1该因素不起作用。

1、SPSS多因素非条件logistic回归分析是解决2012年数模国赛a题的重要工具,spss是常用的多因素分析软件,通过显著性水平来衡量因素对变量的影响。

2、对每个自变量与因变量做相关,看是否有线性关系,有意义的自变量进行分析,分析SPSS多因素非条件logistic分析自变量和因变量,因变量是得分,自变量需要重新编码,都要先编码虚拟变量(虚拟变量个数等于变量数减一)。

扩展资料:

SPSS多因素非条件logistic回归分析功能:

SPSS多因素非条件logistic对于某一特定事物而言它内部的各要素和所有的其它事物都会与它发生联系,我们可以把这种联系称之为影响,把这些与它发生联系的事物、要素称之为因素 ,由此便可以提出一种分析问题的方法即因素分析法。

参考资料来源:

百度百科-SPSS

百度百科-多因素分析法

百度百科-logistic回归

有希望的男人迅雷下载

sg论坛dota2

热门曲谱

Copyright © 2014-2019 曲谱大全(www.qpzxw.com)曲谱自学网版权所有 备案号:皖ICP备2021004734号-1

版权声明:曲谱网所有曲谱及资料均为作者提供或网友推荐收集整理而来,仅供爱好者学习和研究使用,版权归原作者所有。

联系邮箱:qupudaquanhezuo@gmail.com