多组数据的差异性分析用什么方法(医学统计学常见分析方法分类汇总)

医学统计学已经广泛地应用在医学科学研究中。在文献复习与研究设计、实验或观察实施、数据收集与记录、资料整理与分析、结果表达与解释、报告撰写与论文发表等环节无不涉及统计问题。浅浅所以一下医学统计学常用分析方法。

一、差异性研究

差异性研究就是分析不同数据资料之间的差异性。简单可以分为研究单样本、两样本、多样本资料之间均数的差异性比较以及定类数据之间差异性比较;分类说明如下:

多组数据的差异性分析用什么方法(医学统计学常见分析方法分类汇总)

1、单样本均数比较

多组数据的差异性分析用什么方法(医学统计学常见分析方法分类汇总)

单样本均数比较是指研究一组定量数据与一个数字之间的差异性。例如研究36名从事铅作业男性的血红蛋白含量与正常男性血红蛋白均数140g/L的差异。当数据满足正态性时,可以使用单样本t检验方法进行研究;当数据不满足正态性时,可以使用单样本wilcoxon检验进行研究。

2两样本均数比较

多组数据的差异性分析用什么方法(医学统计学常见分析方法分类汇总)

两样本均数比较是指研究两组定量数据之间的差异性。

例如研究两类胶囊的降血糖效果是否有差异;而两样本设计又可以分为两独立样本和两配对样本。

两样本相互独立时——当两样本数据都满足正态性和方差齐性,则可以使用独立样本t检验或者方差分析(单因素方差分析)进行研究;当数据呈正态且方差不齐时,可以使用t'检验或者welch方差、Brown-Forsythe方差进行研究;当数据非正态且方差不齐时,则不能使用参数检验,应该使用非参数检验法—wilcoxon秩和检验进行分析。

两样本为配对设计时——当两配对数据的差值满足正态性,使用配对样本t检验进行研究;当差值不满足正态性时,使用配对样本wilcoxon检验进行分析。

3、多样本均数比较

多样本均数比较是指研究多组定量数据之间的差异性。

例如研究某种药物不同剂量下小鼠的存活时间;而多样本设计又可分为完全随机设计、随机区组设计、重复测量设计。

完全随机设计——要将研究对象按照某个处理因素随机分配为多个处理组(也称为处理因素的水平),每组接受一种处理,最后判断多个处理组之间有无差别。当满足正态性和方差齐性时,使用方差分析进行研究;不满足时,可以使用Kruskal-wallisH秩和检验进行分析。

随机区组设计——是配对设计的扩展。具体做法是:先按影响实验结果的非处理因素(如性别、体重、病情、病程等)将实验对象配成区组(block),再分别将各区组内的实验对象随机分配到各处理组或对照组。当满足正态和方差齐时,使用方差分析进行研究;不满足时,可以使用Friedman秩检验进行分析。

重复测量设计——当前后测量设计的重复测量次数m≥3时,称重复测量设计或重复测量数据。重复测量数据进行组内项差异分析时,需要进行球对称假设,当满足时,直接使用重复测量方差分析结果;当不满足时,采用Greenhouse-Geisser校正或者Huynh-Feldt校正结果分析。

4、定类数据比较

多组数据的差异性分析用什么方法(医学统计学常见分析方法分类汇总)

定类数据之间的差异性研究主要通过卡方检验进行分析。

例如研究患肺癌与是否吸烟之间的差异性;可以将定类数据资料分为四格表资料、R*C资料、2*2*K资料三类。

四格表资料——只有两行两列。又可以分为配对资料和非配对资料两种。

配对资料例如分别使用抗原检测和核酸检测对同一批样本检验***病毒阳性、阴性是否有差异。当为2*2配对设计时,采用McNemar检验;当为n*n配对设计时,采用Bowker检验。非配对资料时,当总样本量n≥40,且期望频率E≥5时,使用Pearson卡方;当n≥40但其中一个格子出现1≤E<5时,使用yates校正卡方;当n<40或者E<1时,使用Fisher卡方进行分析(这一过程SPSSAU将自动选择)。

R*C表资料——当行和列中任意一个大于等于2时,称为R*C表资料。

当E全部>1且 1≤E<5格子的比例小于20%则使用Pearson卡方;否则使用yates校正卡方(SPSSAU将自动选择)。

2*2*K资料——卡方检验研究X和Y的差异,X和Y均是类别数据,当前需要进一步考虑另一个干扰因素分层项时;比如是否吸烟(X)与是否得肺癌(Y)的关系时,将性别纳入考虑范畴此时应该使用分层卡方进行分析。

补充:除此之外,常用的卡方检验还有卡方拟合优度检验,用于分析预期的比例是否与实际的比例有着明显的差异性。

二、相关性研究

研究数据之间的相关性,主要可以使用Pearson相关系数和Spearman相关系数

多组数据的差异性分析用什么方法(医学统计学常见分析方法分类汇总)

当变量XY服从双变量正态分布时,可以使用Pearson相关进行进行相关分析;

Pearson相关系数计算公式如下:

多组数据的差异性分析用什么方法(医学统计学常见分析方法分类汇总)

当变量XY不服从双变量正态分布时,则使用Spearman相关进行相关分析;

当变量XY均为多分类有序资料时,可以用Spearman相关进行相关分析。

Spearman相关系数计算公式如下:

多组数据的差异性分析用什么方法(医学统计学常见分析方法分类汇总)

相关系数没有单位,其值为-1≤r≤1。r值为正表示正相关,r值为负表示负相关,r的绝对值等于1为完全相关,r=0为零相关。在生物界由于影响因素众多,因此很少完全相关。Pearson相关或者Spearman相关都要求观察单位之间是独立的。

三、影响因素研究

研究因变量Y的影响因素时,按照因变量Y类型的不同,可以分为以下三类:

多组数据的差异性分析用什么方法(医学统计学常见分析方法分类汇总)

因变量Y为定量资料时;当自变量个数为1个时,使用一元线性回归分析进行研究;当自变量的个数为多个时,使用多元线性回归分析进行研究。

因变量Y为定类资料时;当Y为二分类变量,如“是否患病”,此时使用二元logistic回归分析进行研究;与此同时,如果是针对配对资料进行分析的,则应该使用条件logistic回归分析。当Y为多分类变量时,使用多分类logistic回归分析。当Y为有序多分类变量时,如“无效、好转、痊愈”,应该使用有序logistic回归分析。

因变量Y为生存资料时:此时共有两个因变量,Y1表示生存时间,Y2表示生存状态,且0表示生存,1表示死亡,两个因变量缺一不可,此时应该使用cox回归。

以上就是今天的全部内容,主要讲了医学统计学比较常用的差异性研究方法、相关性研究方法以及影响因素研究方法。还想看什么其他内容,请留言告诉我哦

(3)
打赏 微信扫一扫 微信扫一扫
上一篇 2023年9月24日
下一篇 2023年9月24日

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请联系我们,一经查实,本站将立刻删除。