安装使用stanford corenlp以及并行加速的全教程

阅读量：

安装并开始使用stanford corenlp

方法一

有两种方式可供选择：一种途径是通过直接调用现成的Python wrapper访问核心功能；另一种途径则是利用Stanford NLP平台提供的Python接口来获取CoreNLP客户端工具，并下载其相关的模型参数以完成部署。获取所需的软件包及其相关的模型参数后即可通过该客户端启动核心NLP服务。

复制代码

    import corenlp
    #tokenize pos lemma 可以选择其他的 这里就不多写了
    client = corenlp.CoreNLPClient(annotators="tokenize pos lemma".split())
    ann = client.annotate(sent)
    
    
    python

缺点

不能并行，会出现以下错误

复制代码

    Cannot assign requested address
    
    
    python

因为只适用于简单的测试，当数据很多，需要并行时，建议使用以下方法

方法二

直接安装（先看完后面，先别安装，这是一个排坑过程！！！！ ）

复制代码

    pip install stanfordcorenlp
    
    
    python

该GitHub项目托管在Lyten等人的GitHub存储位置中。
访问以下下载页面：https://stanfordnlp.github.io/CoreNLP/index.html#download

下载之后解压缩。

下载相应语言模型并放在上面解压缩的包里。

复制代码

    from stanfordcorenlp import StanfordCoreNLP
    nlp = StanfordCoreNLP(r'./stanford-corenlp-full-2018-10-05',lang='en')
    
    sentence = 'Are there any parking meters on the sidewalk near the street?'
    print ('Tokenize:', nlp.word_tokenize(sentence))
    print ('Part of Speech:', nlp.pos_tag(sentence))
    print ('Named Entities:', nlp.ner(sentence))
    print ('Constituency Parsing:', nlp.parse(sentence))
    print ('Dependency Parsing:', nlp.dependency_parse(sentence))
    
    nlp.close() # Do not forget to close! The backend server will consume a lot memery.
    
    
    
    python
    
    
![](https://ad.itadn.com/c/weblog/blog-img/images/2025-08-19/vxgp73AGDJwij9ztTmybYq8HVhZX.png)

但是这样会遇到错误

复制代码

    json.decoder.JSONDecodeError:Expecting value:line 1 column 1 (char 0)
    
    
    python

其实是由于stanfordcorenlp和刚刚下载的安装包之间存在不兼容性,因此建议您使用较早版本3.9.2来避免报错。可访问以下地址获取历史所有安装包：https://stanfordnlp.github.io/CoreNLP/history.html

其余操作同上
最后就可以了

并行处理

想要处理的数据太多

复制代码

    nlp = StanfordCoreNLP(r'/stanford-corenlp-full-2018-10-05',lang='en')
    #进度条
    pbar = tqdm(total=100)
    update = lambda *args: pbar.update()
    def fun(a):
    	return a
    
    
    pool_size = multiprocessing.cpu_count()-1
    print(pool_size)
    p = multiprocessing.Pool(pool_size)
    
    for i in range(100):
    	#可以多个参数
    	p.apply_async(fun, (a,), callback=update)
    p.close()
    p.join()
    
    
    python
    
    
![](https://ad.itadn.com/c/weblog/blog-img/images/2025-08-19/8MTiwNdnp47flIxC61K2eb0aAUQo.png)

此外，在我的需求中希望不同进程能够对同一份数据进行处理，并将各个语法分析的结果存储到一个字典中。

复制代码

    nlp = StanfordCoreNLP(r'/stanford-corenlp-full-2018-10-05',lang='en')
    #进度条
    pbar = tqdm(total=100)
    update = lambda *args: pbar.update()
    def fun(a, share_data_dict, share_lock):
    	# 获取锁
    share_lock.acquire()
    # share_var.append(process_name)
    share_var[img_id] = source_dict
    # 释放锁
    share_lock.release()
    	return a
    
    pool_size = multiprocessing.cpu_count()-1
    print(pool_size)
    p = multiprocessing.Pool(pool_size)
    share_data_dict = multiprocessing.Manager().dict()
    share_lock = multiprocessing.Manager().Lock()
    
    for i in range(100):
    	#可以多个参数
    	p.apply_async(fun, (a, share_data_dict, share_lock), callback=update)
    p.close()
    p.join()
    
    
    
    python
    
    
![](https://ad.itadn.com/c/weblog/blog-img/images/2025-08-19/Emp2Bu3GzqrZklRQLd4ofHXMc5yT.png)

另外两个遇到的错误

复制代码

    pool not running
    
    
    python

复制代码

    joblib.externals.loky.process_executor._RemoteTraceback:PermissionError:[WinError 5]
    
    
    python

全部评论 (0)

还没有任何评论哟~

安装使用stanford corenlp以及并行加速的全教程

安装并开始使用stanfordcorenlp 方法一有两种方式，一种是直接使用已经包装好的pythonwrapper，见网址<https://pypi.org/project/corenlpclie...

Linux安装Stanford-CoreNLP

一、首先需要安装java8 brewcaskinstalljava 安装成功后用命令”javaversion”可查看版本信息二、下载StanfordcoreNLP包 1、下载<https://sta...

在Eclipse下安装和使用Stanford CoreNLP

下载： 1. coreNLP的包，五百多M大小，主要包括这个算法的很多核心jar包。网址：https://stanfordnlp.github.io/CoreNLP/index.htmldownlo...

Stanford CoreNLP使用

StanfordCoreNLP是斯坦福大学的自然语言处理工具包，目前已经支持多种语言的处理。该工具包需要java的支持，因此机器上需要安装java。目前最新的版本是3.9.1。安装过程我不再赘述，我主...

使用NLTK和Stanford CoreNLP

1安装Java 下载jdk8u261linuxx64.tar.gz。解压sudotarcxvfjdk8u261linuxx64.tar.gz 设置环境变量sudovim/etc/profile ex...

python中使用Stanford CoreNLP

1\.确保安装了java环境，下载安装JDK1.8及以上版本 2\.下载StanfordCoreNLP文件，并解压 3\.由于StanfordCoreNLP默认处理英文，如果需要处理其他的语言，可以下...

corenlp分词 stanford_使用Stanford CoreNLP进行中文分词

所以可以直接配置gradle依赖。对不同的语言通过classifier选择对应的model。其中models是其他语言models的基础，默认可以处理English，必须引入。我们需要处理中文，所以还...

Stanford CoreNLP在Android中的使用

下载 StanfordCoreNLP jar包导入与处理因为只实现部分内容，为了使apk不致过大，第二个包进行删减。解决导包的各种报错：build.gradleapp android//配置项目构...

命令行跑stanford-corenlp

在https://nlp.stanford.edu/software/stanfordcorenlp4.5.6.zip 下载stanfordcorenlp4.5.6.zip 在https://stan...

使用Stanford CoreNLP进行句法分析实战

使用StanfordCoreNLP进行句法分析实战目录使用StanfordCoreNLP进行句法分析实战 StanfordCoreNLP 实战代码输出成分树句法分析输出依存树句法分析 Stan...

是否确定退出登录?

安装使用stanford corenlp以及并行加速的全教程

安装并开始使用stanford corenlp

方法一

缺点

方法二

并行处理

全部评论 (0)

相关文章推荐

安装使用stanford corenlp以及并行加速的全教程

Linux安装Stanford-CoreNLP

在Eclipse下安装和使用Stanford CoreNLP

Stanford CoreNLP使用

使用NLTK和Stanford CoreNLP

python中使用Stanford CoreNLP

corenlp分词 stanford_使用Stanford CoreNLP进行中文分词

Stanford CoreNLP在Android中的使用

命令行跑stanford-corenlp

使用Stanford CoreNLP进行句法分析实战