Advertisement

python求均值中位数众数标准差极值

阅读量:

首先需要数据源,这里随便写了一个:

nums = [1,2,3,4]
求均值和中位数均可以使用numpy库的方法:
import numpy as np

#均值
np.mean(nums)
#中位数
np.median(nums)

众数:

众数 方法一:
在numpy中没有直接的方法,但是也可以这样实现:
import numpy as np

counts = np.bincount(nums)
#返回众数
np.argmax(counts)
其中np.bincount方法返回了一个长度为 nums最大值的列表,列表中的每个值代表其索引位数值出现在nums中的次数,例如
返回[2,1,0],代表0在nums中出现2次,而1在nums中出现1次,3在nums中没有出现。

然后再使用np.argmax就能得到众数啦。但是,由于索引值是从0开始的,所以这种求众数的方法只能用在非负数据集。

求众数方法二——直接利用scipy下stats模块【推荐】:
from scipy import stats
stats.mode(nums)[0][0]

标准差:

numpy.std() 求标准差的时候默认是除以 n 的,即是有偏的,np.std无偏样本标准差方式为加入参数 ddof = 1;
pandas.std() 默认是除以n-1 的,即是无偏的,如果想和numpy.std() 一样有偏,需要加上参数ddof=0 ,即pandas.std(ddof=0) ;DataFrame的describe()中就包含有std();

复制代码
 >>> a

    
 array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
    
 >>> np.std(a, ddof = 1)
    
 3.0276503540974917
    
 >>> np.sqrt(((a - np.mean(a)) ** 2).sum() / (a.size - 1))
    
 3.0276503540974917
    
 >>> np.sqrt(( a.var() * a.size) / (a.size - 1))
    
 3.0276503540974917
    
    
    
    

极值:

np.max()

np.min()

全部评论 (0)

还没有任何评论哟~