当前位置：首页>学习笔记>学习笔记:临床回顾性研究实用指南(八)线性回归和Logistic回归

学习笔记:临床回顾性研究实用指南(八)线性回归和Logistic回归

2026-04-17 12:35:09

终于来到第八章啦！这一章也不简单

题外话：

根据笔者多年自学经验来讲，课本或教材上讲的，初读可能看不懂，即所谓“每个字都认识，但连起来就不知道是什么意思了”。结合最近看过的”鸡汤帖“，笔者觉得这种现象大抵因为初学者和作者的思想维度不一样。等学者真正理解，便能领悟原文的意义；一旦能领悟，便忘了自己当初为何不明白，也不再能以初学者的口吻进行描述了。

要想跨越这个思想维度，最快的办法是去接触需求，在实践中理解，在理解中巩固提高；若无法接触实际项目，可以反复研读示例，尽力去领悟，不过要费很多时间、正反馈来得慢，但也请轻易不要放弃。现在伴随着AI的发展，也可以尝试向AI提问，让他以不同倾诉对象的口吻分别来解释，就能从入门级、进阶级、专业级分别来理解，逐步递进。

第八章线性回归和Logistic回归

一、多元线性回归

二、Logistic回归

Logistic回归 Logistic Regression，又名逻辑回归

关键词中英文对照

多元线性回归，多重线性回归 multiple linear regression

决定系数 coefficient of regression

复相关系数 multiple correlation coefficient

校正决定系数 adjusted coefficient of determination

多重共线性 multi-collinearity

极大似然估计 maximum likelihood estimation

优势比 odds ratio

条件logistic 回归 conditional logistic regression

regression 英 /rɪ'greʃ(ə)n/ 美 /rɪ'ɡrɛʃən/

n. 衰退

regression analysis 回归分析；还原分析

regression model 回归模型

regression curve 回归曲线

coefficient 英 /ˌkəʊɪ'fɪʃ(ə)nt/ 美 /ˌkoɪ'fɪʃnt/

n. 系数；(测定某种质量或变化过程的)率，程度；系数

friction coefficient 磨擦系数

coefficient of variation 变异系数；变动系数；变更系数 CV

关键内容摘要

金句：医学研究中，经常需要探讨一个因变量与一组自变量之间的关系。当因变量为连续型变量时，通常可以使用线性和非线性模型来进行统计分析。

简单线性回归研究一个因变量和一个自变量之间的线性趋势的数量关系

多元线性回归分析一个因变量与多个自变量的线性数量关系的方法

1.回归方程：

2.应用条件：

①因变量Y与各个自变量X1 、X2·· … ·Xm存在线性关系；

②各个观测的因变量之间相互独立；

③残差E服从均数为0 ，方差为σ2的正态分布。

3.偏回归系数的假设检验：

F检验和t检验，两者完全等价【SPSS软件-t检验】

其他注意事项

4.自变量筛选：保证自变量均有统计学意义

①全局择优法；②逐步选择法（前进法、后退法、逐步回归法）

5.回归模型的评价：

①决定系数：R2，因变量Y的变异中回归关系所能解释的比例，反映回归贡献的相对程度

②复相关系数：R，反映应变量Y与多个自变量间的线性相关程度，即因变量Y与通过回归方程估计的因变量Y的估计值之间的Pearson相关系数

③校正决定系数

6.样本含量：至少是方程中自变量的5-10倍

7.多重共线性：指某些自变量间存在较强的线性关系，即其中部分自变量可以由其他自变量的线性方程来表示

8.变量间的交互作用

--手动分割线-线性回归与Logistic回归的区分--

	线性回归 Linear Regression	Logistic回归 Logistic Regression
核心用途	预测连续型数值（回归任务）	预测离散型类别（分类任务）
输出类型	连续数值（范围：-∞ 到 +∞）	概率值（范围：0 到 1），通过阈值映射为类别
目标变量	连续变量（如房价、温度、销售额）	二分类或多分类变量（如是/否、A/B/C类）
假设函数
损失函数	均方误差（MSE）：	对数损失/交叉熵：
优化目标	最小化预测值与真实值的平方差	最大化似然估计，最小化分类错误
决策边界	无（直接输出数值）	线性决策边界（概率=0.5处）
数据分布假设	残差服从正态分布，自变量与因变量线性相关	样本独立，特征对数几率与目标线性相关
异常值敏感性	高（平方误差会放大异常值影响）	较低（对数损失对异常值相对稳健）
多重共线性	影响较大（系数估计不稳定）	影响相对较小
计算复杂度	低（解析解或梯度下降）	低（梯度下降，无解析解）
可解释性	系数直接表示特征对数值的影响程度	系数表示特征对对数几率（log odds）的影响
典型应用场景	房价预测、股票预测、销量预测	垃圾邮件识别、疾病诊断、客户流失预测
扩展变体	岭回归、Lasso、多项式回归	Softmax回归（多分类）、正则化Logistic回归

--再次手动分割-概念理解--

Logit与Logistic

Logistic：指Logistic函数（Sigmoid函数），将任意实数映射到(0,1)区间

Logit：是Logistic函数的反函数，将(0,1)区间的概率映射回实数范围(-∞, +∞)

二者互为逆运算：

概率 p ──Logit──> 对数几率 log(p/(1-p)) ──Logistic/Sigmoid──> 概率 p

Logit变换的核心意义

原始概率：被限制在 [0,1]，无法直接进行线性建模

Logit变换后：范围扩展到 (−∞,+∞)，可以用线性模型拟合

原始线性模型：y = w·x + b  →  y可能超出[0,1]，不合理Logit变换后：ln(p/(1-p)) = w·x + b  → 等式左边无界，线性关系成立

log-logarithm (general)-未指定底数，或底数为10

ln-natural logarithm-底数为 e≈2.718

P/(1-P)

流行病学常用的描述疾病发生强度的统计指标 odds优势

若P代表发病概率，则1-P代表不发病概率

若发病概率等于不发病概率，P/(1-P)=1，即优势为1；若发病概率大于不发病概率，则优势大于1；若发病概率小于不发病概率，优势小于1。

两分类Logistic回归

1.回归方程

2.回归系数

常数项β0：暴露量为0时，个体发生事件与不发生事件概率之比的自然对数

回归系数βj：表示自变量Xj改变一个单位时Logit(P)的改变量，与OR有对应关系

3.Logistic回归系数估计与假设检验

极大似然估计：构建一个样本似然函数，求样本似然函数最大时的回归系数，该值即为回归系数的估计值

极大似然估计换成人话来讲：

黑箱摸球游戏中，观察摸十次的结果，发现有七次摸到红球，三次摸到白球，那么箱中球的分布情况是哪种情况，最有可能出现这种结果？

答：红球的比例是0.7

（好吧依然很晦涩）

AI讲解的过程放到同期另一篇推送了，感兴趣可以研究一下，AI真的很会，简要概括如下：

对于临床研究中的似然估计，要抓住的核心要点是：研究目的。从研究目的入手，就很好理解。

「研究任何问题，都不要忘了研究目的是什么」

根据已有的统计数据，梳理可能的致病因素与发病率之间的关系，推算患者的发病几率等，是我们的主要目的。

回归系数就是我们要抓的“关系”，是我们所梳理的方程的关键点。

对回归系数进行假设检验：似然比检验、Wald检验、计分检验

其他注意事项

4.变量筛选：选择回归效果显著的自变量

5.变量取值形式：两分类变量建议取值0和1；无序多分类变量进行哑变量处理；等级变量可以直接以原形式纳入分析，也可以进行哑变量处理；连续型变量若满足线性关系可以直接纳入，若不满足需进行分类，以等级变量纳入模型。

6.样本量考虑：大样本，样本量大于自变量的20倍

7.模型拟合优度检验：

8.回归模型应用条件：

1️⃣各个研究对象之间相互独立【传染病患者之间互相影响】；

2️⃣自变量与Logit变换后的因变量之间存在线性关系

无序多分类和有序Logistic回归

两分类Logistic回归的推广模型

条件Logistic回归

针对配对资料分析的一种方法

以上内容援引自《临床回顾性研究实用指南》，系自行学习总结，如有版权问题请联系删除。

《临床回顾性研究实用指南》学习中，前期笔记链接如下：

学习笔记：临床回顾性研究实用指南（一）

学习笔记：临床回顾性研究实用指南（二）

学习笔记：临床回顾性研究实用指南（三）文献检索及文献管理

学习笔记：临床回顾性实用指南（四）临床回顾性研究的架构

学习笔记：临床回顾性实用指南（五）数据的收集、录入及整理

学习笔记：临床回顾性实用指南（六）临床回顾性研究统计分析概述重要性 ※※※

学习笔记：临床回顾性实用指南（七）常用的统计假设检验方法①

学习笔记：临床回顾性研究实用指南（七）常用的统计假设检验方法②

欢迎关注，共同学习！

本文来自网友投稿或网络内容，如有侵犯您的权益请联系我们删除，联系邮箱：wyl860211@qq.com 。

学习笔记:临床回顾性研究实用指南(八)线性回归和Logistic回归

最新文章

热门文章

随机文章

学习笔记:临床回顾性研究实用指南(八)线性回归和Logistic回归

学习笔记第1558页

山人学习笔记第317期|学会相对积极的解释风格很重要

最新文章

热门文章

随机文章