Advertisement

AI-人工智能指数报告(四):科学、医学与教育

阅读量:

背景

第五章

概述
本年度的《人工智能指数报告》新增了一个章节专门探讨人工智能在科学研究和医学领域的应用,这正是对这一关键领域发挥重要作用的认可。该章节着重介绍了2023年借助于AI取得的重要科学突破,其中包括GraphCast等先进的天气预测系统,以及GNoME等改进型材料发现算法,此外还深入分析了医疗领域的智能技术及其应用效果,例如SynthSR和ImmunoSEIRA等代表性的医疗创新技术,并详细阐述了美国FDA对于此类智能化医疗设备的监管动态也得到了详细阐述

本章摘要
在人工智能的助力下,科学研究的进步更快了 。2022 年时,人工智能就已开始可以加速科学的发现了。但到了 2023 年,从提高算法排序效率的 AlphaDev,到促进材料发现过程的 GNoME,我们见证了更多与科学相关重大人工智能应用的问世。
人工智能帮助医学行业取得了重大进步 。2023 年推出了多项有重要意义的医学系统,其中包括助力提高疫情预测水平的 EVEscape,以及人工智能驱动,协助对突变进行分类的 AlphaMissence。人工智能正日益被用来推动医学的发展。
知识渊博的医学人工智能问世 。人工智能系统近年来在 MedQA 基准(一个评估人工智能临床知识的关键测试)测试的表现也有了显著提升。2023 年一个比较突出的是模型 GPT-4 Medprompt, 其准确率达到了 90.2%,较 2022 年的最高分提高了 22.6 个百分点。自从 2019 年引入该基准测试以来,人工智能在 MedQA 上的表现提高了将近三倍。
美国食品药品监督管理局(FDA)许可的人工智能相关医疗设备的数量在不断上升 。2022 年,FDA 给 139 款人工智能相关医疗设备颁发了许可,比 2021 年增长了 12.1%。自 2012 年以来,获得 FDA 许可的人工智能相关医疗设备数量已增加了 45 倍多。人工智能正逐渐被应用到医疗行业的实践当中。

5.1 值得注意的科学里程碑

AlphaDev
AlphaDev 发现了更快速的排序算法

AlphaDev是一种新型的人工智能强化学习系统。
就短序列排序问题而言,在现有Sort 3、Sort 4及Sort 5等基本排序算法的基础上,
AlphaDev设计的算法指令数量可以更低(如图5.1.1所示)。
其中一些新算法已成功地被纳入到LLVM标准C++排序库中,
这是该库多年来首次进行的系统性更新工作,
也是首个通过强化学习方法进行算法增强的技术方案。

主要应用点集网格生成技术,在计算机图形学领域中构建三维模型成为核心内容。

在这里插入图片描述

Synbot
人工智能驱动,合成有机分子的机器人化学家

Synbot采用了多层次系统架构,在该系统中包含了三个主要组件:一个是用于化学合成规划的人工智能软件平台、一个是负责转换指令执行操作的机器人软件模块以及另一个专门用于实验室实验操作的物理机器人执行单元。为了实现对M1 [4-(2,3-二甲氧基苯基)-1H-吡咯[2,3-b]吡啶]化合物的合成目标,在这一关键实验中研究人员得出了多种可行方案,并且所获得产物的转化率均超过对照组约80%,较传统方法显著缩短了反应时间(如图5.1.5所示)。该系统的成功应用不仅验证了先进的人工智能技术在有机化学工业中的可行性而且还凸显了人工智能在制药及材料科学等领域的巨大潜力

在这里插入图片描述

GraphCast
GraphCast提高了全球天气预报的准确性

该系统采用先进的技术架构,在不到一分钟的时间段内即可完成未来十天的全面气象预测工作。通过结合图神经网络与机器学习算法对海量气象数据进行分析与建模处理,在准确性和效率上均展现出显著优势。如图5.1.7所示,在性能评估方面,本系统的平均误差平方根指标优于当前行业领先的高分辨率预报模型(HRES)。这一成果不仅提升了极端天气事件预警响应效率,在气候研究领域也提供了重要的理论参考依据

在这里插入图片描述

GNoME
GNoME 助力新材料的发现

在许多科学领域,包括在机器人技术与半导体制造领域,寻找新的功能性材料都是推动进步的关键。但这个探索过程通常很耗时而且成本高昂。最近谷歌的研究人员证明了,在大数据集的训练下,图网络(一种人工智能模型)能够加快这一发现过程。他们的模型 GNoME 在发现稳定晶体数量上超过了材料发现领域的领军方法——Materials Project,表现出更加优异的性能。GNoME 发现了 220 万种新的晶体结构,其中很多是人类研究者所忽略的。像 GNoME 这样的项目取得成功,凸显出在数据和规模扩展至加速科学突破方面的威力。
洪水预测
人工智能提升了洪水预测的准确性和可靠性

2023年的一项最新研究在预测大规模洪水活动方面取得了重要进展。洪水作为最常见的自然灾害之一,在发展中国家基础设施相对薄弱的情况下尤其具有破坏性。因此,在全球范围内尽早准确预测此类灾害性的自然现象具有重要意义。谷歌的研究团队开发了一种利用人工智能的高精度水文模拟模型,在未配备监测设施的流域中同样具备实用性。该模型能够提前5天准确预测一些极端洪水事件,并且其性能优于当前最先进的方法(如图5.1.11所示)。该开源模型已在超过80个国家得到了广泛应用。

在这里插入图片描述

5.2 人工智能在医学领域的应用
在医疗保健领域中扮演愈来愈关键的角色的人工智能模型,在过去几年中已扩展到多个应用场景中。这些涵盖从筛查肿瘤前兆如息肉到辅助诊断在内的多个方面。随着人工智能技术的进步,在改善医疗实践方面的作用日益凸显。本节着重介绍了2023年推出的新型医疗AI系统及其临床知识应用进展,并详细探讨了优化医院管理的新一代AI诊断工具与模型的发展动态

值得关注的医疗系统
SynthSR:变革脑部扫描,实现先进分析

该系统能够将临床大脑扫描转化为高分辨率T-1加权影像(见图5.2.1),从而生成详细的三维脑部影像。这一改进缓解了过去由于扫描质量不一致而导致的研究限制。而SynthID则显著增强了大脑结构的可视化与分析能力,在神经科学研究和临床诊断领域发挥了重要作用

在这里插入图片描述

偶联等离子体红外传感器:一种先进的生物医学传感技术

像帕金森病与阿尔茨海默病等神经退行性疾病一样,在诊断过程中也需要依靠生物标志物实现快速且精确地识别。传统的检测手段主要包括质谱技术和酶联免疫吸附试验(ELISA),这些方法在检测蛋白质水平方面表现出色;然而它们无法有效识别结构状态的变化。然而最近的一项研究揭示了一种新型神经退行性疾病诊断方法:该方法通过融合人工智能支持的等离子体红外传感器,并结合了表面增强红外吸收光谱技术(SEIRA)以及免疫分析技术(ImmunoSEIRA),并在附图5.2.3中进行了详细说明。在将人工智能系统的预测结果与实际纤维含量进行对比测试时(见图5.2.4),预测结果与实际报告值之间的准确度已达到了非常接近的程度

在这里插入图片描述

EVEscape:预测病毒演变,预防流行病

评估病毒变异对于疫苗研发具有重要意义,并努力降低流行病传播规模。传统的预测方法依赖实时监测的病毒株和抗体数据,在流行病初期阶段面临数据不足的问题。EVEscape 是一种基于历史序列、生物物理原理以及结构信息构建的新的人工智能深度学习模型。该模型无需当前特定病毒株的数据即可独立评估其逃逸能力,并能够预判病毒感染趋势的变化方向。研究数据显示,在测试样本中,EVEscape 的预测精度显著优于实验室研究中的46.2%及32.3%结果,相较于前人研究仅能达到24%的预测准确率而言,精度提升显著(如图5-2-6所示)。这一创新性成果表明,EVEscape 可能在未来加强疾病预防与应对策略方面发挥重要作用

在这里插入图片描述

AlphaMissence:人工智能帮助对突变进行更好的分类

目前科学家仍无法确定导致哪些遗传突变会引起疾病,在数量庞大的潜在基因变异中判断一个变异是否为良性的或致病性必须进行冗长而乏味的研究

在2023年开发了一种新型人工智能模型AlphaMissense后,在生物信息学领域取得了突破性进展。该模型可识别7100万个潜在基因突变体中影响人类蛋白功能并可能导致癌症等疾病的一种特定类型——错义突变(missense mutations)。AlphaMissense能够将这总计约71百万个突变体分为三种类型:约57%可能为非致病性突变体、约32%可能为致病性突变体以及其余部分未确定性质(如图5.2.8所示)。相比之下,在现有技术中仅能鉴定约千分之一即其中不到千分之一的具体性质。

在这里插入图片描述

人类泛基因组参考:用人工智能绘制人类基因图谱

人类基因组是一份整体的分子代码库。最初的人类基因组图谱是在2000年发布的第一份草图,在随后的时间里被不断补充和完善。这次更新未能充分涵盖所有遗传变异类型和复杂的祖先关系。因此,在现有的基因组参考下对特定人群的疾病检测或治疗方案设计将面临诸多挑战。

2023年,人类泛基因组研究联盟由来自60家机构的119名科学家共同参与,借助人工智能技术完成了更新版本的人类基因图谱,该图谱在准确性和代表性方面均有显著提升(参见图5.2.10)。具体而言,注释区域内的编码蛋白基因中位数达99.07%,对应的转录本覆盖率为99.42%,非编码基因为98.16%,非编码转录本为98.96%。这一最新成果不仅涵盖范围广,还展现了人类遗传多样性最为丰富的特征。

在这里插入图片描述

临床知识
评估人工智能模型在临床领域的知识水平涉及确定其掌握的相关医学专业知识领域,在实际临床环境中可应用的知识掌握的程度。

MedQA

自 2020 年起推出的综合性医疗问答数据库系统MedQA(Medical Question and Answer, 简称MedQA),基于职业医师资格考试体系构建,并包含超过6万项临床疑问。该系统的人工智能表现得到显著提升,在最新一轮的基准测试中达到91%的准确率(见图5-3)。相较于两年前提高了约18个百分点(见图5-3)。自推出以来其性能已较之前提升了近三倍展现了临床知识型人工智能快速发展的能力

在这里插入图片描述

诊断
FDA 批准的 人工智能相关医疗设备

FDA负责发布获得批准的人工智能与机器学习结合使用的医疗设备列表。列出的所有医疗产品都符合FDA设定的各项准入资格要求。截至今年10月,FDA尚未发放任何基于生成式人工智能技术或由大语言模型(LLM)驱动的产品相关执照。

图5.4.7展现了近十年来FDA批准的人工智能医疗设备数量的变化趋势。数据显示,在过去一年中(即二零二二),FDA批准的人工智能相关医疗设备总量达到了一百三十九台;相较于上一年度(即二零二一),这一数字上升了十二点一 percent。值得注意的是,在二零一二年之后,“AI医疗设备”的数量以惊人的速度实现了增长——已较最初的基础数量提升了四十五倍。”

在这里插入图片描述

图5.2.21记录了获得FDA批准的医疗设备的专业分布情况。根据统计,在过去一年中获得FDA批准的139种医疗设备中،大部分与放射学领域密切相关(占87.1%)。此外,在这些获批设备中占比最高的是心血管专业领域(占7.2%)。

在这里插入图片描述

第六章 教育 概述

本章研究人工智能与计算机科学(CS)教育的发展趋势及其相关问题。研究重点包括不同群体的学习参与情况及其发展趋势。鉴于当前社会对人工智能在教育领域应用日益引起关注,在此背景下进一步分析教师与学生在ChatGPT等新型AI工具辅助下的学习实践

主要采用了Computing Research Association每年进行Taulbee调查所得的数据作为分析依据。该报告首先对美国与加拿大高等教育机构在计算机科学及人工智能教育领域的现状进行了全面介绍,并随后对欧洲计算机科学教育领域的相关信息进行了详细分析。值得注意的是今年特别加入了来自Studyportals的数据,并对此进行了深入探讨。

此外,在本章末尾还对美国K–12教育中的计算机科学教育分析进行了介绍,并详细探讨了沃尔顿基金会关于学校采用ChatGPT技术的研究成果

本章摘要
美国和加拿大计算机科学(CS)学士毕业生人数持续增加,硕士毕业生数量相对稳定,博士毕业生数量略有增长 。尽管美国和加拿大新学士毕业生数量已连续超过十年在稳步增长,但选择攻读计算机科学研究生的学生人数却变得相对平稳。自 2018 年以来,计算机科学硕士和博士毕业生的数量略有减少。
人工智能博士向产业界转移的趋势正在加速 。2011 年,人工智能博士毕业后选择进入产业界(40.9%)和学术界(41.6%)的比例大概是相等。但到了 2022 年,已经有很大一部分人选择了毕业后进入产业界(70.7%),相比之下呆在象牙塔的只有 20.0%。仅在过去一年的时间里,选择到产业界就业的人工智能博士比例就上升了 5.3 个百分点,这表明高校人才流失到产业界的情况正变得更为严重。
产业界跳槽到学术界的学术人才减少 。 2019 年时,美国和加拿大新增的人工智能教职员工当中有13%是来自产业界的。到 2021 年时,这个数字已降至 11%,到了 2022 年又进一步降至 7%。这个趋势表明从产业界跳槽到学术界的高层次人工智能人才在不断减少。
国和加拿大的计算机科学教育国际化程度下降 。与 2021 年相比,2022 年获计算机科学本科、硕士和博士学位的国际学生的比例降低了。尤其硕士生这一类,国际学生的降幅格外突出。
修计算机科学课程的美国高中生更多了,但可得性的问题依然存在 。2022 年,共有 201000 名学生参加了高级计算机科学(AP CS)考试。自 2007 年以来,参加这些考试的学生数量已增长超十倍。不过,近期的证据显示,在较大的高中和郊区地区上学的学生更有可能有机会上计算机科学课。
全球范围内与人工智能相关的学位课程不断增加 。自 2017 年起,用英语授课的人工智能相关高等教育学位课程数量已经增长了三倍,且过去五年一直在稳定增长。全球的大学提供的以人工智能为中心的学位课程正日益增多。
在信息学、计算机科学、计算机工程以及信息技术研究生的输出数量上,英国和德国在欧洲处于领先位置 。英国和德国培养出欧洲最多的信息学、计算机科学、计算机工程和信息技术本科、硕士和博士新增毕业生。从人均角度来看,芬兰在培养本科和博士毕业生方面居领先地位,而爱尔兰则在培养硕士毕业生方面领先。

焦点:ChatGPT在师生当中的使用情况
针对教育领域的作用上, 生成式人工智能技术如 ChatGPT 的推出引发了广泛的争议。一些人担忧, 这些技术可能会被不当地用于学术诚信问题, 从而可能导致对美国教学方法的重新审视。

鉴于沃尔顿家族基金会(Walton Family Foundation)的赞助支持,研究机构 Impact Research 展开了一系列调查活动以探讨美国教师和教育工作者对人工智能工具 ChatGPT 的使用情况及态度。研究结果表明,在接受调查的一线教师群体中约70%已开始使用ChatGPT技术。在过去一年中使用率有所提升:在2023年3月时有51%的教师承认曾至少使用过一次ChatGPT工具;至7月份时这一比例增长至63%,具体数据可见图6.2.9所示图表分析。此外,在接受过ChatGPT培训的一线教师群体中约51%的人群主要应用于课程规划开发;另有约51%用于开发富有创意的新教学方法;而剩下的48%则主要用于提升自身的专业知识储备(如图6.2.10所示)。

不过无论是教师还是学生,在大多数情况下都抱有极其正面的态度对 ChatGPT 持开放态度。

本文翻译来自于神翻译局

全部评论 (0)

还没有任何评论哟~