Advertisement

中科院NLPIR中文分词java版应用方法

阅读量:

基于自然语言处理的汉语分词系统别称为 ICTVLAS2013;其主要功能如下:对中文文本进行拆分;识别词语属性;采用命名实体识别技术;提供自定义词汇库功能;支持GBK编码和UTF-8编码的处理。

NLPIR的下载地址:

http://ictclas.nlpir.org/downloads

我下载的是20160509171502_ICTCLAS2016分词系统下载包.zip

解压后打开文件,如下图所示:

然后打开sample文件,把里面的JnaTest_NLPIR文件当作项目导入MyEclipse,导入后如下图所示:

为了运行这个项目,在NlpirTest.java文件中存在一个名为main的函数,并且需要修改其中的相关地址参数

第一处:

第二处:

这两处位置主要作为文件下载和解压使用。建议根据个人需求自行设置解压路径。运行完成后,请查看以下结果:... 这里保留数学公式或其他格式内容,并适当补充相关描述性语言以使文字更加丰富详尽。

全部评论 (0)

还没有任何评论哟~