脑科学统计方法总结
1 假设检验
假设检验是指总体上作出某项假说,并从总体中随机抽取一个样本进行分析。通过该样本对所作假说进行验证以判断其真实性与否。其中,在总体上的假说可分为两种类型:显著性水平α和显著水平。
设定关于母体参数的一个假说,
通常会针对母体数字特征设立一个假说,
通过利用样本数据进行验证分析,
这种类型的方法被称为参数假说检验法,
在统计学中被广泛采用。
(2)基于母体分布建立某种假设后,在母体中抽取子样进行验证以判断该假设是否成立的问题属于统计学中的分布假设检验范畴。在脑科学领域的研究中广泛采用的参数型显著性检验方法包括t检验。
t检验(t-test)是一种在统计学中非常常见的显著性检验方法,在特定条件下具有重要的应用价值。具体而言,在总体方差未知的情况下且样本均值服从正态分布时就可以应用该方法进行差异显著性判断。
该方法的基本前提是研究对象的数据必须遵循或近似遵循正态分布在某些变换处理下仍然无法满足这一条件时则需要转而采用非参数型显著性检验方法作为替代方案。
需要注意的是当研究样本的数量超过30个时通常可接受数据呈现总体呈正态分布在这种情况下即使原始数据并不严格满足严格的正态性假定其结果仍然具有较高的可靠性和准确性。
t检验最常用的四个应用场景 :
1)单样本均值检验(One-sample t-test)。适用于当总体方差未知且研究对象满足正态性假设的数据时,在已知总体均值情况下判断某组数据其均值是否显著差异于 hypothesized population mean。
2)两个独立样本均值检验(Independent two-sample t-test)。用于判断一对相互独立的正态分布的数据或其分布接近正态的情况下的样本均值是否相等,在实际应用中通常根据总体方差是否已知或假设其相等性来进行分类讨论。
第三部分采用配对样本均值检验(Dependent t-test for paired samples)进行分析。该方法旨在检测 一对成对样本之间的均值差异 是否与某个预设的数值存在显著差异。
回归系数的统计显著性测试。该方法旨在评估回归模型中各解释变量是否对被解释变量产生统计上的影响程度。
1)单样本t检验
目的:考察单个样本均值与其总体均值之间是否存在显著差异。
要求:
- 当样本方差未知时,则可采用t检验(也称U检验)。
2)数据需服从正态分布或接近正态分布。
例子:我们可以通过单样本t检验来考察这些指标(如功能连接性分析中的重要指标如FA、ALFF等;或网络特征如聚类系数、小世界网络参数等)是否与预期均值存在显著差异。 
2)两个独立样本均值比较
目的:确定两个独立样本的平均值是否存在显著差异。
要求:两个样本相互独立,并且各自服从正态分布或接近正态分布。
例子:例如,在研究健康人群与病人之间比较网络指标或影像特征时,通常采用双侧t检验。
3)配对样本均值检验
常见的情形有:配对的受试对象分别接受不同的处理(如将小白鼠配对为两组,分别接受不同的处理,检验处理结果的差异)
同一受试对象的两个部分接受不同的处理(如对于一批血清样本,将其分为两个部分,利用不同的方法接受某种化合物的检验,检验结果的差异)
同一受试对象的自身前后对照(如检验癌症患者术前、术后的某种指标的差异)
要求:总体方差相等;正态数据或近似正态
4)回归系数的显著性检验
目的:以多元线性回归模型为例, 检验回归系数是否显著不为零(通常取零作为检验值)。一方面旨在检验该回归系数对应的解释变量对被解释变量的影响是否显著, 另一方面也用于判断该解释变量在模型中是否存在作用(若接受其对被解释变量作用为零的假设, 则应从模型中剔除该项)。
以多元线性回归模型为例, 写作:
{{Y}_{i}}={{\beta }_{0}}+{{\beta }_{1}}{{X}_{1i}}+{{\beta }_{2}}{{X}_{2i}}+\cdots +{{\beta }_{p}}{{X}_{pi}}+{{\varepsilon }_{i}} , \mathbf{\varepsilon }\tilde{\ }\mathbf{N}\left( \mathbf{0},{{\sigma }^{2}}{{\mathbf{I}}_{n}} \right)
基于显著性检验的方法, 我们构建统计量用于显著性检验.
为了确定解释变量 {{X}_{j}} 对被解释变量 Y 的重要影响程度以及其作用大小,我们需要判断回归系数{{\hat{\beta }}_{j-1}} 是否具有统计学意义。
探讨两组人群的功能连接梯度模式间的差异性时, 可构建回归方程如下:
gradien{{t}_{i}}={{\beta }_{0}}+{{\beta }_{1}}*ag{{e}_{i}}+{{\beta }_{2}}*se{{x}_{i}}+{{\beta }_{3}}*grou{{p}_{i}}+{{\varepsilon }_{i}}}
其中, 重点考察解释变量grou{{p}_{i} 对应的回归系数{{\beta }_{3} 的显著性水平, 即评估其对gradien{{t}_{i} 的影响程度。这一研究框架不仅适用于上述特定情境, 还可在广义线性模型框架下扩展至更为复杂的统计分析场景。
2 方差分析
在数据分析领域中,方差分析被视为一种评估调查或试验结果之间差异程度的有效统计工具,在实际应用中常被用来比较不同处理或条件下的结果表现。其核心目标在于判断不同组别之间的数据是否存在显著差异。根据自变量的数量不同, 方差分析可分为单因素、双因素及多因素方差分析等主要类型。
单因素方差分析能够对比一个自变量(如区分是否吸烟对健康的状况影响);而双因素方差分析则能对比两个自变量(如区分是否吸烟或精神分裂对健康的两种不同影响);多因素方差分析则能对比三个及以上自变量(如评估多个影响因素对健康的综合影响)。
