Advertisement

spss分析qpcr数据_数据的相关分析及SPSS算例

阅读量:
600a2a1a0e0445b938a9fac7b4a38b47.png

之前写过一个用excel做的相关系数文章《用Excel做数据间的相关系数》(点击查看),可以再次温习。

那么今天主要讲一下用SPSS做相关分析。

Excel的数据分析能力比SPSS还是稍微弱一点的,毕竟SPSS也是主要分析数据的一个软件,那么在相关分析的这里就凸显了它的强大之处,您再次读这篇文章《用Excel做数据间的相关系数》,会发现,Excel中的相关系数的分析只是皮尔逊(Pearson)相关分析。而SPSS中包括了三种相关分析(Pearson/ Kendall’s tau-b / Spearman)。
5b3e51b3d19ad8f11b8c82d00d1404bc.png

世间万物除了因果关系、共变关系还有相关关系。相关关系中分为正相关、负相关和不相关,体现在数字上就是[-1,1]。若想形象的表示两种数据之间的关系,可以制作一个相关关系散点图。相关还有偏相关,偏相关是指将其他变量影响予以排除,求两个变量之间的关系。这些用SPSS软件都能做到。
f31d1152866c8714bc2478ffdf5ef888.png

下面说一下这三种相关系数的特点。

1、Pearsoncorrelation coefficient皮尔逊相关系数

它是由卡尔·皮尔逊从弗朗西斯·高尔顿在19世纪80年代提出的一个相似却又稍有不同的想法演变而来的。

该相关系数的前提条件最严格:

(1)成对数据;

(2)变量呈正态双分布;

(3)两列变量是连续变量;

(4)两列变量之间的关系是线性关系;

(5)数据间的差距不能太大。

所以我们用pearson相关系数之前要进行数据正态验证。

2、Kendall’stau-b correlation coefficient 肯德尔相关系数

它是一种秩相关系数,也就说它是做按顺序排列的数据相关分析,而且分析的对象是分类变量,比如说人的帅气程度(很帅、帅、一般帅、不帅),没有皮尔逊相关系数的那么多前提条件。

3、Spearman correlation coefficient 斯皮尔曼相关系数

由英国心理学家、统计学家斯皮尔曼根据积差相关的概念推导而来。它也是分析有顺序的数据相关性,有线性关系的数据,没有皮尔逊相关系数的那么多前提条件的约束。

所以说不是正态分布的数据,可以用后两种相关系数进行分析。
18dc36c54aafc36858acc0c163e175f3.png

演示一下SPSS怎么操作

打开软件自带的数据集employee data,我们要分析初始工资和目前工资的相关性。

1、我们首先看一下他们的数据是否呈正态性

这里用到非参数检验(Nonparametric tests),即在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。其实也可以用其他方式进行正态检验,可参考下面参考文献。

这里就说一下非参数检验,如下图,依次点击分析→非参数检验→旧对话框→1-样本K-S,
4bc5d21d164f3afdb87a4cbad346ecd7.png

这里面有个正态检验,翻译的是“常规”,这就是正态分布(Normal distribution),其他几个叫均匀分布、泊松分布、指数分布。我们把初始工资和当前工资放到检验变量列表。
b499312d35c9a592c8e9aa149fff0f58.png

点击确定,出结果,发现p<0.05,不是正态分布。那我们就不能用皮尔逊相关系数了(实际上实验数据一般与正态分布相差不大,可以用皮尔逊相关系数,这里就用斯皮尔曼相关系数了)。
f953a2177b41590cea9eb3d7c1e0cc25.png

2、我们检验一下线性情况

这里用到散点图

如下图,依次点击图形→旧对话框→散点
faacaa5965ae99dad2469135942e7596.png

选择第一个简单分布
07b8be5a469ade67d3e3c5f3bc358b6a.png

将当前工资放入第一个Y轴,初始工资放入第二个X轴
7f483c2cc161d0ce433485a9dcde13a4.png

可以点击标题,加标题
556b67bd5dfaf9ddeaf07936594a4efa.png

点击确定,出图,发现初始工资和目前工资,它们之间是呈线性关系的。
519e5db0c7b5fbbf784ecdfd80aa436e.png

3、进行相关分析

依次点击分析→相关→双变量
fe0a7d317eba00d0d99f0701a67b40ae.png

把初始工资和目前工资放入变量内,选择斯皮尔曼相关系数,双尾检验,标记显著性相关。
0312b08c53f6a5b434c2c7e17474631c.png

点击确定得到结果,发现他们的相关性是0.826,还是比较强相关的。
58e19271b7592251ad13e00b6153a0e6.png
567849f9f4365371129cff4f2fa35c60.png

下面是一个补充内容,

距离的分析,

我们还是以初始工资和目前工资做分析。

如下图依次点击分析→相关→距离
7e1293b6e4ab27b3b9089edabf62e965.png

把初始工资和目前的工资放入变量,选择变量间,相似性,点击确定。
be333dc63e9cd25af598e3dfdba854fe.png

出结果,相关性0.880
005b03c8970d9cb9057ba3bbca9410c3.png

我们求一下皮尔逊相关系数,发现跟距离的一样,可知,距离用的是皮尔逊方法。
bbd41d47ce4f92f8c4a20db53b89fc33.png

参考文献:

[1] 统计学三大相关系数,

[2] 几个相关系数:Pearson、Spearman、pointbiserialr、kendalltau,

[3] kendall秩相关系数,

https://baike.baidu.com/item/kendall秩相关系数/6246854?fr=aladdin

[4] 皮尔逊相关系数,

https://baike.baidu.com/item/皮尔逊相关系数/12712835?fr=aladdin

[5] spearman相关系数,

https://baike.baidu.com/item/spearman相关系数/7977847?fr=aladdin

[6] spss如何进行正态性检验

https://jingyan.baidu.com/article/e6c8503cb5fc7be54e1a1860.html

[7] 赵小军,祁禄.SPSS数据分析:问题提出与实例导学[M].北京:中国水利水电出版社,2011。

欢迎讨论!

微信文章随笔,描述不当的地方,望指正!

若侵权,请联系本人删除!

欢迎大家投科学相关的稿件。

爱生活,爱科学!

全部评论 (0)

还没有任何评论哟~