朴素贝叶斯算法Python实现

阅读量：

复制代码

 # -*- coding: cp936 -*-

    
 #朴素贝叶斯分类器的实现
    
 #运行
    
 #reload(docclass)
    
 #c1=docclass.naivebayes(docclass.getwords)
    
 #docclass.sampletrain(c1)
    
 #c1.classify('quick rabbit',default='unknown')
    
 #构建训练样本
    
 def sampletrain(c1):
    
     c1.train('Nobody owns the water.','good')
    
     c1.train('the quick rabbit jumps fences','good')
    
     c1.train('buy pharmaceuticals now','bad')
    
     c1.train('make quick money at the online casino','bad')
    
     c1.train('the quick brown fox jumps','good')
    
 import re
    
 import math
    
 #从文本中提取特征
    
 def getwords(doc):
    
     splitter=re.compile('\ W*')
    
     #根据非字母字典进行单词拆分
    
     words=[s.lower() for s in splitter.split(doc) if len(s)>2 and len(s)<20]
    
     #只返回一组不重复的单词
    
     return dict([(w,1) for w in words])
    
  
    
 #分类器
    
 class classifier:
    
     def __init__(self,getfeatures):
    
     self.fc={}
    
     self.cc={}
    
     self.getfeatures=getfeatures
    
     #classifier.__init__(self,getfeatures)
    
     self.thresholds={}
    
  
    
     def setthreshold(self,cat,t):
    
     self.thresholds[cat]=t
    
  
    
     def getthreshold(self,cat):
    
     if cat not in self.thresholds:
    
         return 1.0
    
     return self.thresholds[cat]
    
  
    
     def incf(self,f,cat):
    
     self.fc.setdefault(f,{})
    
     self.fc[f].setdefault(cat,0)
    
     self.fc[f][cat]+=1
    
  
    
     def incc(self,cat):
    
     self.cc.setdefault(cat,0)
    
     self.cc[cat]+=1
    
  
    
     def fcount(self,f,cat):
    
     if f in self.fc and cat in self.fc[f]:
    
         return float(self.fc[f][cat])
    
     return 0.0
    
  
    
     def catcount(self,cat):
    
     if cat in self.cc:
    
         return float(self.cc[cat])
    
     return 0
    
  
    
     def totalcount(self):
    
     return sum(self.cc.values())
    
  
    
     def categories(self):
    
     return self.cc.keys()
    
  
    
     def train(self,item,cat):
    
     features=self.getfeatures(item)
    
     for f in features:
    
         self.incf(f,cat)
    
     self.incc(cat)
    
  
    
     def fprob(self,f,cat):
    
     if self.catcount(cat)==0:
    
         return 0
    
     return self.fcount(f,cat)/self.catcount(cat)
    
  
    
     def weightedprob(self,f,cat,prf,weight=1.0,ap=0.5):
    
     basicprob=prf(f,cat)
    
  
    
     totals=sum([self.fcount(f,c) for c in self.categories()])
    
  
    
     bp=((weight*ap)+(totals*basicprob))/(weight+totals)
    
     return bp
    
  
    
     def classify(self,item,default=None):
    
     probs={}
    
  
    
     max=0.0
    
     for cat in self.categories():
    
         probs[cat]=self.prob(item,cat)
    
         if probs[cat]>max:
    
             max=probs[cat]
    
             best=cat
    
             
    
     for cat in probs:
    
         if cat==best:
    
             continue
    
         if probs[cat]*self.getthreshold(best)>probs[best]:
    
             return default
    
         return best
    
         
    
 class naivebayes(classifier):
    
     
    
     def docprob(self,item,cat):
    
     features=self.getfeatures(item)
    
  
    
     p=1
    
     for f in features:
    
         p*=self.weightedprob(f,cat,self.fprob)
    
     return p
    
  
    
     def prob(self,item,cat):
    
     catprob=self.catcount(cat)/self.totalcount()
    
     docprob=self.docprob(item,cat)
    
     return docprob*catprob

全部评论 (0)

还没有任何评论哟~

朴素贝叶斯算法Python实现

coding:cp936 朴素贝叶斯分类器的实现运行 reloaddocclass c1=docclass.naivebayesdocclass.getwords docclass.sampletr...

朴素贝叶斯算法（python 实现）

利用朴素贝叶斯贝叶斯算法实现分类本文主要通过python构建朴素贝叶斯分类算法：原理：贝叶斯公式，朴素的理解：假设个特征之间相互独立，则上面公式中: 通过此公式，可将未知的条件概率转换为已知条...

朴素贝叶斯算法python实现

各位读者，今天我们来聊聊，朴素贝叶斯算法实例代码朴素贝叶斯算法代码实现，现在让我们一起来看看吧！目录一、两个学派 1.1频率学派： 1.2贝叶斯学派二、朴素贝叶斯 2.1简介 2.2相关公式 2...

朴素贝叶斯算法实现

朴素贝叶斯，名字中的朴素二字就代表着该算法对概率事件做了很大的简化，简化内容就是各个要素之间是相互独立的。实现步骤： 1，创建Beyes类 2，类中包括四个方法，初始化方法用来创建保存中间计算结果的...

朴素贝叶斯算法实现

数据集链接【免费】泰坦尼克存亡数据集-用于数据挖掘算法资源-文库 # Author : Haoer importrandom importpandasaspd # 多项式朴素贝叶斯分类器 classM...

朴素贝叶斯算法python sklearn实现_朴素贝叶斯算法——实现新闻分类（Sklearn实现）...

1、朴素贝叶斯实现新闻分类的步骤 1提供文本文件，即 2准备数据将数据集划分为训练集和测试集；使用jieba模块进行分词，词频统计，停用词过滤，文本特征提取，将文本数据向量化 3分析数据：使用mat...

朴素贝叶斯算法代码实现,朴素贝叶斯算法的作用

大家好，本文将围绕朴素贝叶斯算法实例代码展开说明，朴素贝叶斯算法代码实现是一个很多人都想弄明白的事情，想搞清楚朴素贝叶斯算法的作用需要先了解以下几个事情。朴素贝叶斯 1.简介贝叶斯分类算法是统计...

朴素贝叶斯算法代码实现,朴素贝叶斯算法的作用

这篇文章主要介绍了朴素贝叶斯算法实例代码，具有一定借鉴价值，需要的朋友可以参考下。希望大家阅读完这篇文章后大有收获，下面让小编带着大家一起了解一下。目录 1\.朴素贝叶斯原理 1.1.特性 1.2....

朴素贝叶斯算法_C语言实现朴素贝叶斯算法（Naive Bayes）

NaiveBayes 朴素贝叶斯算法，是应用最为广泛的分类算法之一。该算法利用贝叶斯定理与特征条件独立假设做预测，直接且易于理解。该算法在实际运用中，往往能得到意想不到的好结果。 1.算法介绍朴素贝...

三种常用的朴素贝叶斯实现算法——高斯朴素贝叶斯、伯努利朴素贝叶斯、多项式朴素贝叶斯

在sklearn中，提供了若干种朴素贝叶斯的实现算法，不同的朴素贝叶斯算法，主要是对Pxiy的分布假设不同，进而采用不同的参数估计方式。我们能够发现，朴素贝叶斯算法，主要就是计算Pxiy，一旦Pxiy...

是否确定退出登录?

朴素贝叶斯算法Python实现

全部评论 (0)

相关文章推荐

朴素贝叶斯算法Python实现

朴素贝叶斯算法（python 实现）

朴素贝叶斯算法python实现

朴素贝叶斯算法实现

朴素贝叶斯算法实现

朴素贝叶斯算法python sklearn实现_朴素贝叶斯算法——实现新闻分类（Sklearn实现）...

朴素贝叶斯算法代码实现,朴素贝叶斯算法的作用

朴素贝叶斯算法代码实现,朴素贝叶斯算法的作用

朴素贝叶斯算法_C语言实现朴素贝叶斯算法（Naive Bayes）

三种常用的朴素贝叶斯实现算法——高斯朴素贝叶斯、伯努利朴素贝叶斯、多项式朴素贝叶斯