湖南工业大学计算机科学与技术 MATLAB : 数据描述性分析实验
发布时间
阅读量:
阅读量
湖南工业大学计算机科学与技术 MATLAB : 数据描述性分析实验。报价250


1、实验目的和任务
目的:熟悉常用数据描述性分析方法方法、统计作图法及多维数据相关分析。
任务:使用程序语言计算观测数据的均值、方差、标准差,变异系数,偏度,峰度;中位数,上下四分位数,四分位数极差;做直方图和经验分布函数图;Pearson相关系数和Spearman相关系数。
2、实验内容
2002年11月以及1至11月全国省、直辖市、自治区财政预算收入数据如表1所示,设X1为11月预算收入,X2为1至11月预算收入,分别对X1,X2的观测值计算:
1)均值、方差、标准差,变异系数,偏度,峰度;
2)中位数,上下四分位数,四分位数极差;
3)做直方图,并讨论区间(容器)数量nbins对直方图的影响,nbins可取10,20,30,40。
4)做出经验分布函数图,并讨论区间(容器)数量nbins对经验分布函数图的影响,nbins可取10,20,30,40。
5)X1、X2观测值的Pearson相关系数和Spearman相关系数。

3、实验过程及结果
1) 实验内容1:均值、方差、标准差,变异系数,偏度,峰度

(2) 计算过程;

(3) 计算结果;

实验内容3:
做直方图,并讨论区间(容器)数量nbins对直方图的影响,nbins可取10,20,30,40



4、4) 实验内容
4:做出经验分布函数图,并讨论区间(容器)数量nbins对经验分布函数图的影响,nbins可取10,20,30,40


5) 实验内容5


6) 程序代码
clc;
filename = 'experiment_data1.txt';
n=31;
[x]=textread(filename,'%s');
x=reshape(x,[3 31]);
x=x';
xlswrite('filename.xls', x)
name=x(:,1);
x=str2double(x(:,2:3));
x_=mean(x)%均值
S=std(x)
S2=S.*S
g1=skewness(x) % 偏度:>0 称为右偏态,<0,称为左偏态
g2=kurtosis(x) % 峰度:用作衡量偏离正态分布的尺度之一
CV=S./x_*100 %变异系数
M= median(x) %中位数
Q1 = prctile(x,25)
Q3 = prctile(x,75)
R1=Q3-Q1
nbins=10;
hold on
subplot(2,2,1);
[h1 xout1]=hist(x(:,1),nbins);%直方图
bar(xout1,h1)
title('直方图1')
subplot(2,2,2);
[h2 xout2]=hist(x(:,2),nbins);%直方图
bar(xout2,h2)
title('直方图2')
for i = 1:nbins
func(i) = sum(h1(:,1:i));%累加
end
hold on
%cdfplot(x);
subplot(2,2,3);
plot(xout1, func/n, 'b-', 'LineWidth', 1);%绘制经验分布曲线
title('经验分布函数1');
for i = 1:nbins
func(i) = sum(h2(:,1:i));%累加
end
hold on
subplot(2,2,4);
plot(xout2, func/n, 'b-', 'LineWidth', 1);%绘制经验分布曲线
title('经验分布函数2');
X1=x(:,1);
X2=x(:,2);
pearson_r = corr(X1,X2)%默认Pearson系数
Spearman_r= corr(X1,X2, 'type' , 'Spearman')%Spearman系数
代码解读
experiment_data1.txt
北京 35.22 499.80
天津 10.41 161.37
河北 17.22 273.29
山西 10.70 134.79
内蒙古 10.29 90.92
辽宁 18.66 348.99
吉林 4.41 106.89
黑龙江 6.24 196.44
上海 49.72 656.95
江苏 47.70 580.70
浙江 36.55 518.10
安徽 14.85 179.41
福建 19.46 250.16
江西 10.93 122.06
山东 40.26 552.74
河南 19.82 268.20
湖北 19.49 221.43
湖南 16.01 197.68
广东 99.32 1080.26
广西 14.77 160.60
海南 3.96 39.51
重庆 10.49 111.76
四川 21.71 250.09
贵州 13.06 95.87
云南 20.34 183.62
西藏 0.77 6.08
陜西 11.38 133.50
甘肃 3.66 64.86
青海 1.21 18.30
宁夏 2.31 23.81
新疆 3.24 103.81
代码解读
filename.xls

全部评论 (0)
还没有任何评论哟~
