AI-人工智能技术
一、人工智能简介
1.1.人工智能定义和发展历史
人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。
人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。
ANI :弱人工智能
AGI:强人工智能
1.2.人工智能发展必备三要素
1.2.1.三要素
1)数据
2)算法
3)计算力:CPU,GPU,TPU
CPU:主要适合IO密集型任务
GPU:主要适合计算密集型任务
计算密集的程序:所谓计算密集型的程序,就是其大部分时间花在寄存器运算上,寄存器的速度和处理器的速度相当,从寄存器读写数据几乎没有延迟,可做一下对比,读取内存的延迟大概几百个时钟周期,读硬盘的速度就不说了,即使是ssd,也是很慢的
构建人工智能所需的基础要素
支撑人工智能发展的核心技术
从广义上讲, 人工智慧涵盖了广泛的领域; 而机器 学习则被视为当前较为有效的实现途径之一
在这一层次上, 人工智慧的概念最为广泛
机器 学习被认为是一种较为有效的方法
其中, 在深度 学习领域取得了显著进展
近年来, 在这一领域取得了显著进展, 并逐渐取代了大部分传统的 机器 学习方法
三者的关系如 图1 所示
从字面意义上看,在理论上探讨并研究开发能够模拟、延伸以及拓展人类智能的知识体系以及实践模式是一门新兴的技术科学。由于该定义主要侧重于描述其目标而非具体的方法论支撑,在实现人工智能的过程中仍需探索多样化的途径和其他手段的运用
2.1、数据科学
2.1.1 数据科学定义
当今时代是数据驱动的时代,并由此催生了数据科学这一新兴学科。数据科学是一门多学科交叉的综合性学科,在涵盖了数据获取、数据分析、数据管理和知识挖掘等方面的基础上,并逐渐成为揭示大数据本源并将其转化为可执行智能的有效手段。
数据分析并不是一个全新的概念,在历史上已有较早的记载。
近年来人工智能领域的兴起促使数据分析逐渐引起了人们的关注。
数据分析是通过算法从大量数据中提取潜在信息的过程。
数据分析通常与计算机科学相关,并结合统计分析、实时数据分析处理等技术手段来实现相关目标。
2.1.2 数据科学应用场景的流程
- 数据采集阶段
- 数据分析环节
- 假设检验与行动规划
- 持续更新数据并循环优化过程
2.1.3 数据科学于机器学习对比
2.2、计算机视觉
(1)定义:
计算机视觉是对生物视觉系统的模拟过程。它的核心职能即在于通过分析图像或视频数据来重建物体在三维空间中的位置与形态。就像人类以及其他许多生物每天都在进行的日常活动那样简单而基础。
计算机视觉不仅是一门技术学科更是一种方法论学科它研究如何利用数字设备感知并理解外部世界中的物体及其运动规律这一过程具有重要的理论价值和应用前景。形象地说这就像给机器安装了一双"眼睛"(照相机)和一个"大脑"(算法)使它们能够像人类一样感知并解读世界。中国古语有云"所见即所得"西方社会则常用"One thousand pictures are worth more than a hundred words."来形容图像的力量与作用这一点在计算机视觉系统中体现得尤为明显可见其应用前景是多么广阔而远大。
(2)应用:
计算机视觉具有多方面的应用领域,并非局限于单一用途。具体而言,在医疗成像分析方面,则用于提高疾病预测、诊断和治疗的准确性和效率;而Facebook则将人脸识别技术用于自动识别照片中的个人身份;此外,在安防及监控领域,则利用相关技术进行嫌疑人身份确认;最后,在购物场景中,则允许消费者通过智能手机拍摄产品来获取更多商品选择机会。
2.3、自然语言处理
3、自然语言处理:
(1)定义:自然语言处理(NLP)是计算机科学与人工智能等学科交叉领域的重要组成部分,在探讨人与计算机(自然)语言相互作用方面发挥重要作用。因此,在人机交互领域具有重要应用价值。NLP面临诸多挑战包括自然语言理解问题等,并涉及广泛的人机交互领域。在NLP众多研究方向中还包括自然语言生成等问题:
文本分类:给定一段文本内容可通过建立分类模型实现对其所属类别进行预测工作如垃圾邮件过滤系统可用来筛选出不符合要求的邮件邮件类型也可根据输入文本判断其来源并进行分类工作此外还可通过对原始文本进行语言风格分析以及题材分析来判断虚构作品的故事类型等:
语言建模:基于现有的语料库学习并生成新的文章标题合理安排句子结构进而形成有意义的段落或完整的文档同时能够为用户提供后续可能接续的句子建议以提高内容的整体质量:
语音识别:通过分析语音信号提取关键信息并将其转化为对应的书面文字如自动转录会议录音为会议记录提供支持还可以将这些语音信号转换为相应的文字内容生成适合屏幕显示的文字脚本以供后续使用:
说明生成:根据给定场景信息提供相应的描述内容并设计合适的标题如为一张照片拟定吸引眼球的标题或是为一段视频制作有意义的主题描述以便于观众理解和记忆:
信息抽取
信息抽取是通过从嵌入在文本中的非结构化信息中识别并转换为结构化数据的过程来实现的,在自然语言处理领域中从文本语料中提取命名实体之间的关系研究是一种基于命名实体识别更深层次的应用技术。其主要过程包括三个阶段:首先对非结构化数据进行自动化预处理工作;其次针对性地进行文本信息的采集;最后将获取的信息进行规范化表示输出以完成结构化处理的目的。其中最为基础的工作是实现对命名实体的识别任务而其核心目标则是实现对实体间关系的精准刻画与提取机制的设计与开发。
自动文摘
自动文摘是一种利用计算机技术按照特定规则自动生成简明扼要摘要的信息压缩技术旨在实现语言表达更加简洁的同时又能有效保留原始文本中的重要信息内容以满足快速阅读与知识获取的需求特点适用于新闻报道科技文章以及各类专业文献等场景下的内容精炼与提炼工作流程上主要包含以下几个关键环节:首先通过对原文本内容进行深度分析筛选出具有代表性的关键信息点;其次对选定的关键点进行语义关联分析构建完整的知识网络框架;最后按照逻辑顺序将各知识点有机整合形成层次分明主题明确的摘要报告以达到高效传递知识的目的
语音识别技术
语音识别技术是指让机器能够通过感知和理解声音信号从而将其转化为相应的文字或操作指令的技术体系旨在实现人机之间"听觉交流"的基本功能其核心目标是将人类发出的声音信号中的语音符号转化为计算机能够理解和处理的文字形式或执行相应的控制指令过程通常包括以下几个步骤:一是将连续的人声信号分解为时域或频域上的特征参数;二是基于声学模型对这些特征参数进行分类匹配;三是结合语言模型对最终输出结果进行最优路径选择以确保识别结果的准确性和连贯性整个系统架构大致可分为前端降噪模块、后端特征提取模块以及中间状态匹配决策模块三大部分按照循序渐进的方式完成整个流程的设计与优化任务
机器翻译:机器翻译即指将一种语言的源文本转译为另一种语言。该技术利用语言模型分析并生成目标语言的文本。
2.4、机器学习
2.4.1.什么是机器学习
机器学习是一门多学科交叉专业,涵盖概率论知识,统计学知识,近似理论知识和复杂算法知识,使用计算机作为工具并致力于真实实时的模拟人类学习方式,并将现有内容进行知识结构划分来有效提高学习效率。
机器学习有下面几种定义:
(1)机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能。
(2)机器学习是对能通过经验自动改进的计算机算法的研究。
(3)机器学习是用数据或以往的经验,以此优化计算机程序的性能标准
2.4.2.机器学习工作流程
1.获取数据
2.数据基本处理
3.特征工程
- 机器学习(应用算法进行模型训练)
- 模型验证
运行结果满足预期, 投入生产状态
运行结果未达预期, 转为下一步流程
2.4.3 机器学习算法分类
-
监督学习
输入数据集由输入特征向量以及对应的标签向量组成
其输出结果可能是连续型变量(即回归问题)
或者其输出结果属于预先定义的类别集合(即分类问题) -
无监督学习
由输入特征变量构成的数据集合缺乏明确的目标变量。
样本数据未被标注信息且结果不明确。
待分类的样本集合类别归属尚不明确。
基于样本间相似度的评估可实现对全体样本的分类整理。
3.半监督学习
训练集同时包含有标记样本数据和未标记样本数据
4.强化学习
实质是自动进行决策,并且可以连续决策
在机器学习领域中,决策树被视为一种关键的预测建模技术。该方法通过构建层次分明的节点关系来实现特征划分与类别预测。具体而言,在该模型中每个节点代表一个单独的输入变量x及其对应的分割点(假设x为数值型变量)。其模型表示采用二叉树结构。这属于算法与数据结构中的二叉树类型,在此上下文中并无特殊含义。
决策树模型
支持向量机
间距被定义为超平面与最近数据点之间的距离。在支持向量机中,能够最好地区分两类别的超平面具有最大的间距。仅这些关键点参与了超平面的定义及其分类器的构建过程。这些关键数据点称为支持向量,它们支撑或决定了超平面的位置。
SVM 可能是最强大的立即可用的分类器之一,值得一试。
Bagging 和随机决策森林
随机决策森林因其卓越的性能而成为机器学习领域最受欢迎的方法之一。它是一种基于 Bootstrap 方法的集成学习技术。
在数据分析中,Bootstrap方法是一种有效的统计工具用于估算参数。例如,在估计总体均值时通常采用此方法。通过有放回地随机抽样生成多个Bootstrap样本集,并计算每个样本集的均值后取其算术平均以获得更准确的总体均值的无偏估计。
bagging 采用了与之相似的方法;然而它旨在估计整体统计模型;其中最常见的应用是基于决策树;从训练数据中抽取了多个样本;为每个样本构建相应的模型;在需要对新数据进行预测的情况下;各个模型分别生成预测结果;将所有预测结果取平均以期更准确地逼近真实输出值
随机森林
该方法被改进为随机森林模型;在构建随机森林的过程中,决策树被生成以利用引入随机性带来的次优分割效果而非仅仅追求最佳的分割点。
由此可见,在为每个数据样本构建模型时会体现出各自的特征与特点;尽管这些方法在理论上各具特色并存在差异性但它门仍能保持较高的准确性;综合各模型预测结果能够更加精准地推断出真实输出值。
如果采用具有较高方差的算法(如决策树)表现出良好的性能,则通常可对该算法施用 bagging 技术以进一步提升性能。
Boosting 和 AdaBoost
总结
即使是经验丰富的数据科学家,在尝试各种算法之前也难以判断哪一种算法表现最佳。尽管存在其他类型的机器学习算法,但本文着重讨论的是最常用且效果显著的那些方法。对于刚开始接触机器学习的人来说,这是一个理想的学习起点。
2.4.5.机器学习模型评估
1.分类模型评估
2。回归模型评估
3.拟合:用于评估该模型的性能。经过训练后的模型的性能分为两类不同的表现。
2.4.6.深度学习简介
概念源于对人工神经网络的研究。
多层感知器即为深度学习的一种结构形式。
其研究目的是为了模拟人脑机制并解释数据间的复杂关系。
深度学习可被视为一系列模式分析技术的总称,在研究范畴内主要涵盖以下三种类型:
(1) 以卷积运算为基础构建起的一系列神经网络体系架构即为卷积神经网络(CNN),其通过多层次的空间感受野提取图像特征并实现自动目标识别任务;
(2) 基于多层神经元构建起的自编码神经网络体系则包括自编码器(Auto encoder)以及近年来备受关注的稀疏编码方法(Sparse Coding),其主要功能是通过非线性变换实现数据的低维稀疏表示;
(3) 在对多层自编码神经网络进行预先训练的基础上结合判别性信息进行参数优化的方式构建而成的就是深度置信网络(DBN),它能够有效提取高层次抽象特征并提升分类模型性能
2.4.7.深度学习各层负责内容
2.4.8 深度学习典型模型 1 卷积神经系统
2)深度信任网络模型
DBN可被解释为一种贝叶斯概率生成模型,在其架构中包含多层随机隐变量构成,在上下两层之间形成无向对称连接关系,在各层次间建立有向连接通路,在底层单元的状态被设定为可见输入数据向量的形式。DBN由多个结构单元堆叠而成,在这种堆叠结构中通常采用受限玻尔兹曼机(RBM)作为基本构建模块。在堆叠中的每一个RBM单元都具备可变的数量设置:其可视层神经元数目等于前一层RBM所具有的隐层神经元数目。基于深度学习机制,在输入样例训练第一层次RBM的过程中,并利用其输出结果来训练第二层次RBM模型;通过将各个RBM模块依次叠加形成多层数组构建方式来提升整体性能水平;在无监督预训练阶段中,则通过将DBN模型映射到顶层RBM并进行状态编码后反推出底层单元的状态值以实现输入数据的重建过程;其中每一层次的RBM均作为整体DBN架构的一部分共享参数配置。
3)堆栈自编码网络模型
堆栈式自编码网络体系与DBN架构具有相似性特征,在其组成模块中同样包含多个结构单元堆叠而成;但区别在于其中的基本构建模块并非受限玻尔茨曼机(RBM),而是采用自编码器(Auto-encoder)这一替代性设计方式;在这种设计下自编码器体系由两个主要功能层面构成:第一层面被称为编码器部分、第二层面则对应于解码器部分。
第2章第4节第9小节 深度学习训练过程
将多种认知技术如机器视觉和自动规划整合到小型但高性能的传感器、制动装置以及设计精巧的硬件中,从而形成了机器人。它能够与人类协作工作。例如无人机等工业设备及协作机器人(cobots)等社会化的作业设备就已开始进入实际应用。
2.6、语音识别
语音识别主要是关注自动且准确地转录人类的语音技术。
语音识别的主要用途涵盖医疗音频识别、手写语音输入技术以及计算机辅助语音控制等多方面领域。最近开发出了一个支持用户通过语音指令完成下单流程的移动应用程序。
第三部分 AI相关领域的研究与实践 第一小节 AI应用场景介绍 在多个领域中广泛运用
在新闻领域中, 个性化推荐系统基于大数据与人工智能技术已逐渐发展成为多种新闻App的标准配置; 自动化内容生成工具 智能视频编辑工具等生产工具正持续发展出现
在教育行业中,人工智能已被广泛应用于作业批改、英语教学等教学项目中,并深入探究"私人订制"和"千人千面"等定制化学习方案;
在语音识别与机器翻译领域中目前能够实现的是全球支持数十种热门语言间的互译工作以及涵盖多个不同的翻译方向。
在金融领域中,生物识别技术的应用已经实现了刷脸支付的可能性;基于低投入提供定制化的财富管理服务的智能投顾正在快速发展中。
在物流行业领域内,在线订单分配系统、智能配送设备等产品与服务正在不断推动快递公司提高运营效率与服务质量
在零售行业中除了引人注目的创新性探索性应用之外 人工智能还被用于分析和预测超市中生鲜食品销售量
在交通相关领域中,在地图和导航等应用之外的地方(即除了地图和导航等应用之外),无人驾驶技术也取得了最新的动态。
在医疗行业中借助人工智能技术和大数据分析能力从而使得计算机能够识别、解析以及评估医学影像数据以便帮助医生进行诊断判断
至于已经形态化的产品,小编给大家举几个实例。
人工智能车牌识别系统
具体功能:主要功能包括车牌信息自动采集(包含牌照的各类信息),准确识别各类字符(包括汉字、数字及颜色),同时具备对违法黑牌车辆实施抓拍并发出报警信号的功能;实现系统内部与车管部门数据的即时共享与更新;权限管理模块独立设置;前端采集的信息能够实时上传至服务器,并在网络中断时进行数据续传
人工智能辅助驾驶
微软人工智能Torque中文版
去年2月 Microsoft 推出了专为中国安卓用户提供的一款人工智能产品 Torque 中文版。这款产品标志着 Microsoft 在安卓平台上推出的首个人工智能应用,并且也是其首次针对可穿戴设备的产品。Torque 的目标是通过最小化的界面实现信息传递最直接、最及时的方式。Torque 的出现解放了安卓用户的双手, 让他们只需轻握腕部即可执行如 "快乐大本营主持人"、“最近肯德基在哪" 或 "给某人打电话" 等指令,从而轻松获取所需信息并完成更多任务——这正是 Microsoft 对移动互联时代移动生产力与效率的理解与追求
人工智能仿生眼
曼彻斯特皇家眼科医院近日率先开展全球首个人工仿生眼植入手术治疗 AMD 导致的视力丧失。这项创新技术被称为 Argus II 人工仿生眼装置,由两大部分组成:一是内置于视网膜层的可穿戴部件;二是供外界使用的辅助设备。植入装置通过微创手术被植入病人的视网膜层,并内置电极阵列用于信号采集及传输,并配备电池续航系统及无线通信功能。配戴一副特制护目镜的患者需佩戴额外的眼镜片;该装置内置前向摄像头并配备无线电发射模块;此外还配备了视频处理单元以完成图像传输功能。
Skype实时翻译工具
微软推出了一款人工智能产品—实时翻译工具Skype Translator,该产品融合了语音识别技术以及深度神经网络等技术.它能够实现不同语言语音通话与即时通信消息的自动翻译.目前,该系统已覆盖英语、西班牙语、意大利语以及普通话等多种语言.此外,即时通信消息的翻译服务也已延伸至法语、日语、阿拉伯语等50多种语言,其中包括威尔士语和克林贡语等小语种.如同上文所述,人工智能并非仅限于机器人这一形态,从学科划分来看,它涵盖了机器人技术、语音识别与自然语言处理等多个领域
四、如何选择人工智能项目
1.怎样选择人工智能项目
技术考察:技术是否可以实现
商业考察:是否符合商业模式
价值考察:是否可以创造价值,提升价值
道德考察:是否遵循道德规则和底线五、人工智能的发展和未来
1.人工智能产业属于战略性产业,全球各国家、企业都纷纷抢占技术制高点。我国人工智能产业技术基础已经具备,各应用场景的技术研发及落地也进展顺利,人工智能的产业化应用趋势日趋明朗。
2.人工智能应用场景侧变现在即,发展前景及钱景都不可限量。2019年中国人工智能市场规模达到489.3亿元,增长率27.5%。人工智能的场景落地以及市场开拓将在各行各业中稳定展开。预计到2022年,中国人工智能市场规模将超过千亿元、人工智能是典型的高增速、大增量的蓝海市场,未来行业发展前景广阔。
3.人工智能应用技术多元化,市场分割性强,有较好投资切入点。人工智能技术门槛较高,目前大多数的领域的发展还依赖于国家技术战略的推动以及资本的推动。人工智能的市场分割性主要存在于技术应用场景方面,巨头大而全的布局难以深度介入,这也正是初创企业以及正在转型的非巨头上市公司机会所在。
