Advertisement

人工智能 计算机语言学,语言学与人工智能的未来

阅读量:

原标题:语言学与人工智能的未来

在讨论人工智能时,人们普遍认为---机器人!这并非偶然现象而是受思维惯性的影响.

人工智能是一种对人类智能现象的模仿,并非简单地复制其思维过程。它的发展路径似乎并未遵循由低级到高级的演进模式,在某些特定领域却能表现出超出人类的能力。这种现象在动物界也有体现——例如一只松鼠就能记住成百上千个松果的埋藏位置,在这一方面它甚至超越了人类的理解能力

人类智能具有多元性,在学习能力方面也并非最为卓越。研究表明,在某些领域中的人类表现可能不及由深度学习驱动生成的人工智能。然而,在判断过去信息真伪方面,这可能是人类大脑的主要功能。

什么是人类智能?

从字面来看, 它由"智"与"能"两个部分组成. 其中, "智"主要体现为认识事物的能力; "能"则主要体现为执行行为的能力, 包括各种技能以及良好的习惯等. 它们是一个不可分割的整体, 是人凭借已有的知识与经验去学习新的知识与概念, 并成功地将这些知识与概念转化为解决实际问题的能力. 劳动、学习以及语言交流等活动都是智慧与能力统一的结果, 是人类独有的智力表现. 而语言则是这种高度抽象表现的具体体现.

人类智能可以分类为:

4a917a93716592bed8408f9bb62d485c.png

什么是语言?

语言是思维的重要载体同时也是物质存在的基础构成部分二者缺一不可这一观点已得到广泛认同人类认识到自身为人的过程始于对语言概念的认知正是因为语言世界呈现出清晰可辨的轮廓并且通过语言构建了丰富的世界靠概念与意义符号编织出了世界的秩序而思维的概念体系及逻辑结构必须建立在语言生成的基础之上

人类语言是一种复杂而精妙的符号系统。另一种说法是:人类用来交际的不是实实在在的事物而是代表事物的符号。习得并掌握了这些符号的人就知道这些符号所代表的意义。这些符号的本质特征就是主观属性或说是任意性规定:我们通常认为玫瑰象征爱情但实际上并没有必然联系(玫瑰本身不具备象征爱情的功能)。

从这一角度来看,在人类社会中语言作为一种文化现象是对客观世界的抽象概括与表达方式;然而,在面对同一个客观世界时不同民族或村落的人们却发展出了各自独特的编码模式来描述各自的世界观,并且这些描述能够在母语者那里得到准确的理解与复现;相比之下动物通讯机制可能不具备这种特征因此在严格意义上动物的'语言'应被视为通讯信号而非抽象的符号系统而后者则是理性思维与高级信息传递的重要载体

什么是语言学?

源自"language studies"这个术语

人工智能时代的语言学

人类的思维活动可以被看作是一种符号运算的过程;人类的语言理解过程同样也是一种在知识表达上的计算过程。这表明,在技术层面实现计算机理解自然语言的可能性得以确立。因此,在语言理解研究的基础上进一步发展出的就是语言的计算分析这一领域。

对语言有处理能力是人工智能的一种高级表现形式。

语言智能的范畴的不完全统计:

· 词法和句法分析

· 语义分析和理解

· 语言模型

· 语音计算

· 文本分类和聚类

· 信息检索和信息抽取

· 自动文摘和自动作文

· 自动问答和人机对话

· 机器翻译

自然语言处理和计算语言学

在人工智能领域中,自然语言处理(NLP)是一项核心领域的研究方向。在计算机科学的发展背景下形成的新兴技术已被广泛认可,并被认为是该学科体系中的一个重要组成部分。

714b85e98a61159258cd5109c4d6723e.png

加州大学洛杉矶分校视觉认知学习与自主机器人中心主任朱松纯教授将人工智能划分为六个方面(如上图)。目前这些领域相对分散,在相互融合的过程中逐渐统一。

NLP的目标是实现高效且适用于处理自然语言的算法。例如:基于字序列标注的中文分词、HMM进行词性标注、CKY与Early算法、n-gram模型以及噪声信道模型等都属于NLP领域的研究成果。尽管统计方法在统计NLP方面取得了巨大的进展...但在深入探讨语言学理论方面相对较少。

为什么我们要进行对话呢?语言的本质在于它是人类用来传递思想与情感的一种方式。通过交流达成一致意见并制定统一行动方案是我们达成一致行动的基础保障。出于寻求独特的观点与思维方式的需求,并非所有的人都会选择相同的沟通路径;相反地,在某些情况下人们会选择逆向思维的方式去探索问题的新视角,在这种情况下往往能够激发出特殊的创意火花。

在大规模语料库的支撑下进行的机器学习技术其本质就是概率最大化模型它倾向于使用最普遍的语言表达方式都认同这一观点因而这种语言模式往往让人觉得平淡无奇在当前研究中遇到的技术瓶颈问题上许多NLP领域的研究者们都在引入一些语言学的知识来帮助他们提取更多的训练特征并构建更加可靠的分析框架

计算语言学是研究人类自然语言的科学,并且是 linguistics 学科的重要分支领域之一。该学科致力于发展一套便于机器处理的语言理论体系,并构建相应的分析框架与模型系统。其中WordNet便是基于认知 linguistics 构建的一个典型实例。而 WordNet 便由 Princeton 大学的研究团队共同开发的一种基于认知 linguistics 的英文系统作为典型的 cognitive linguistic model

在NLP与计算语言学领域的发展中

鉴于计算语言学具有其特定特征,在研究过程中学者需具备广泛的知识储备特别是对语言学以及计算机技术领域的深入学习。为了掌握对语言的认知与领悟能力有必要探究并理解其在逻辑构造上存在的紧密关联同时还要关注其多变性和特殊性以及内在自我反思的特点这些特质均未被人们所掌握与认知。而计算机技术则为我们实现对传统及现代语义系统的优化改进提供了重要手段不仅能够提高其现代化程度以及推动其科学化发展并且可能带来根本性的变革

人类语言&人工智能语言

当前社会已大量接触机器生成的语言,在线翻译网络实时翻译系统和智能客服机器人逐渐普及。涉及文字处理与应用领域逐步被人工智能取代包括天气预报、体育赛事解说等信息传播领域。另一方面由于计算能力限制机器在理解和生成复杂语义方面仍存在较大局限性因此提高机器翻译质量必须解决基础理论问题而非仅仅依赖算法优化未来人工智能发展道路依然漫长

‘I cannot believe that I have read through so easily. The incredible power of the human mind, according to research conducted at Cambridge University, is not affected by the order in which letters appear within a word. The only important thing is that the first and last letters be in their correct positions.

2017年10月30日,著名前微软亚洲研究院院长兼首席科学家、微软全球执行副总裁沈向洋博士出席清华大学高等研究院杰出学人讲座并主讲人将分享题为《理解自然语言:描述、对话和意境》的专题报告。他主张,在未来十年中人工智能将在自然语言处理方面取得重大进展,并指出‘通晓语言者方能掌握天下’。

如果你对计划计算语言学这门学科感兴趣,建议大学阶段课程:

当代汉语研究的主要领域包括当代汉语的发展特征分析以及东西方古代语言发展历史的研究;其核心内容涵盖当代汉语的语言现象描写与分析;主要包含以下几个方面:一是当代汉语的语言现象描写与分析;二是东西方古代语言发展历史的研究;三是当代汉语的语言现象描写与分析;四是当前语音语调特征研究;五是语音语调特征的科学规范以及相应的技术手段研究

  1. 计算机相关:人工智能、现代逻辑、模式识别、数据结构

  2. 数学:高数、概率论与数理统计、离散数学、线性代数

  3. 计算语言学:中文信息处理概论

参考文献:

[1] 尚富华.李军.人工智能及其运用[M].北京:石油工业出版社,2005.5.

[2] 钱学森.关于思维科学[M].上海:上海人民出版社,1986.年.

[3] 何华灿等.人工智能导论[M].西安:西北工业大学出版社,1988年.

[4] 蔡自兴.徐光祐.人工智能及其运用[M].北京:清华大学出版社,2004.8.

[5] 范德清.魏宏森.现代科学技术史[M].北京:清华大学出版,1988.

[6] 王永庆.人工智能原理与方法[M].西安:西安交通大学出版社,1999年.

[7] 张云峰.人类智能与人工智能[J].深圳.沿海企业与科技,2003.3.

--------------------

原创出品

===============

17710862437返回搜狐,查看更多

责任编辑:

全部评论 (0)

还没有任何评论哟~