NLP概述
1. 什么是NLP
自然语言处理(NLP)是人工智能(AI)领域的重要组成部分之一。**它主要专注于人类之间的交流以及计算机与人类之间的交流所涉及的语言问题这一学科领域。**为了构建复杂的人工智能系统并提升其性能水平,自然语言处理旨在设计相应的计算框架,并探索能够有效实现目标的各种方法和技术手段;通过这种方式能够开发多种实用工具,并探索评估这些工具的有效性。
2. NLP主要研究方向
- 信息提取 :从给定文档中提取关键信息如时间、地点、人物、事件等。
- 内容生成 :机器像人一样利用自然语言进行表达与写作。
- 问题解答系统 :针对自然语言表达的问题提供精准答案。
- 对话系统 :通过一系列互动与用户交流并完成任务。
- 内容挖掘 :包括聚类分类情感分析以及可视化交互展示。
- 语音识别与合成 :将语音符号转换为书面语及将书面文转为语音表征。
- 信息过滤系统 :利用计算机自动识别过滤特定文档信息。
- 舆情监测分析系统 :收集处理海量数据并自动化分析网络舆情。
- 全文索引服务 :对大规模文档建立词汇加权索引并排序推荐候选文档。
- 机器翻译系统 :将源语言文本自动转换为目标语言的文本。
3. NLP的发展
在20世紀中葉:圖靈測試
1950-1970:主流:基于规则形式语言理论
乔姆斯基运用数学公理化的方法深入研究自然语言的发展;他将代数与集合论相结合来系统地定义形式语言,并将其表示为符号序列;他致力于用有限数量的基本规则来解释无限多的语言现象;通过他的研究工作揭示了人类普遍使用的语言机制;基于上述理论基础提出了关于人类普遍语法的概念
自1970年代以来,主流方法采用基于统计的技术
2010年以后:逆袭:机器学习
AlphaGo依次击败李世石与柯洁等选手,在全球范围内引发了人工智能领域的热潮。随着深度学习与人工神经网络等技术的兴起,在语音识别、图像识别、机器翻译以及自动驾驶等领域取得了显著进展。
4. NLP任务的一般步骤
这边有一些图片看不清楚的,您也可以通过百度脑图来查看

5. 我的NLP启蒙读本
6. NLP、CV,选哪个?
NLP :自然语言处理,数据是文本。
CV :计算机视觉,数据是图像。
这两个领域本质上是不同的,在面对这一问题时我也曾思考了很久,并经过一番思考后得出了以下结论:都依赖于深度学习技术来解决现实世界中的各种挑战:缺少CV支撑的NLP将难以发展;仅有NLP而无CV的支持也将面临困境。这两个领域之间既有紧密的联系却又各有独特的特点!
自然语言处理与计算机视觉属于两个互不相同的学术研究领域。它们都具有很高的学术价值,并且可以根据个人的兴趣偏好来决定最适合自己研究的方向。人工智能作为跨学科的前沿技术,则需要综合运用多个领域的知识储备。每个研究者都有自己独特的研究重点,在专注自己热爱的专业方向时必定能够取得显著成就!
这里提供一些参考资料给大家阅读阅读,做出适合自己的选择:
- 一文看尽2018全年AI技术大突破:NLP跨过分水岭、CV研究效果惊人
- 《数学之美》–吴军
- [BERT时代与后时代的NLP](
