国内 AI大模型产业发展深度分析 2024
伴随人工智能技术的快速推进,
AI 大模型已发展成为全球科技制高点、新兴产业赛道及经济发展新引擎。
其巨大发展潜力与广泛应用前景备受重视。
近年来我国高度关注人工智能技术发展,
将其提升至国家战略层面并推出了一系列支持政策和发展规划,
为AI 大模型产业提供了良好发展生态。
当前,在通用、行业及端侧领域的大模型犹如雨后春笋般涌现其应用落地将加速推进在新一代人工智能产业中大模型正发挥着核心推手的作用它不仅广泛赋能经济建设和社会发展等各领域还为实现通用人工智能的发展目标提供新的动力这一时代背景下产业发展所处阶段所面临的主要挑战以及未来发展的方向等问题都将成为社会各界共同关注的重点这些问题亟需社会各界携手共同应对
2023年人工智能大模型迎来爆发性的增长,在科技创新和社会生产生活中带来了深远的影响、巨大的机遇以及面临的挑战。全球范围内的大模型竞赛日益白热化,在这一背景下国内大模型领域涌现出一批具有竞争力的优秀产品
大模型在电力、零售、出版等传统行业中取得显著成效,并展现出改造提升传统产业的巨大潜力。大模型通过赋能金融、医疗等若干行业实现提质增效,并在促进新质生产力快速发展的过程中发挥关键作用。
大模型持续健康地发展,在政策法规的支持下得以保障,并满足包括隐私保护与数据安全在内的多个方面的要求。展望未来的大模型将不断深化技术创新,并广泛应用于各个行业领域为其社会提供全方位的高质量发展新动力。
AI 大模型的出现推动了利用人工智能技术来生成内容的发展过程,并实现了从"易得性"向"实用性"的转变。生成内容已成为各行各业的普遍需求。如今,在电商、影视和传媒等领域的应用已经取得了显著进展。
实现大模型商业化需从供给侧和需求侧双管齐下。从供给侧来看,在Transformer等基础技术层面仍面临着较高的成本挑战;当前大模型在降低开发成本与提升使用价值方面仍具有优化空间。在需求侧方面,在企业应用AI大模型时必须投入巨额资金、大量人力资源以及时间资源来加强自身的数字化水平。展望未来,在生成内容的质量从"实用"向"高效"演进的过程中, 人工智能或许将经历新一轮的技术范式变革。
**2024年将成为大模型快速进步的关键期,在政策层面推出的"人工智能+"行动计划将提供有力支持;与此同时,随着用户对生活和工作效率的需求日益增长,这一领域的发展将面临更大的机遇;在科技公司的持续加大AI领域投入资金与人力以及技术研发的基础上,各环节协同作用下得到充分支撑.**然而,当前的大模型产业仍面临诸多挑战:计算资源分配不够合理,Transformer架构是否能达到最佳性能仍存疑;相关领域内的高质量数据资源较为匮乏;尚未形成广泛认可的现象级应用场景.从产业发展角度来看,未来可能会有大量企业选择专注于特定领域的深度研究,转向探索具体应用场景和开发创新的应用产品.对于vivo而言,整合其端到端技术优势与矩阵化技术能力后,将专注积累丰富的手机行业应用经验;通过大模型技术实现对各项功能进行重构优化,精准识别并定位可落地的实际场景;以更低的成本惠及更多消费者.
第一章 扬帆起航:中国 AI 大模型产业发展背景
1.1 中国 AI 大模型产业发展政策驱动力
近年来我国始终把人工智能发展机遇作为战略重点来抓,并制定了相关政策体系。在2017年,《新一代人工智能发展规划》被国务院制定出台,在此基础上科技部及其下属六个部门于2022年又联合印发了《关于加快场景创新、推动人工智能高水平应用促进经济高质量发展的指导意见》,并对国家规划进行了具体实施。
根据《政府工作报告》明确指出并启动实施"人工智能+"战略行动计划。随着人工智能技术领域的快速进步尤其是大模型技术的迅速崛起这一趋势促使我国各地积极制定相关政策以推动相关产业的持续健康发展。
目前,包括北京,深圳,杭州,成都,福建,安徽,上海和广东在内的多个地区均已发布与 AI 大模型相关的政策.下面具体阐述:
北京市政府大力推动大模型相关技术创新工作,并致力于打造一个高效协同的大模型技术产业生态体系;
上海强调打造具备国际竞争力的大模型;
深圳将重点推动构建以国内外先进芯片与算法为基础的开放源代码通用人工智能模型,并促进重点企业持续研发、优化并投入应用这一技术。
安徽从资源方面着手吸引大模型企业入驻;
成都致力于在多个领域开展大模型技术研发与迭代工作。重点在多个领域开展研发与迭代工作,并涵盖CV型式的大model研究与优化工作。同时,在医疗行业 concentrate on 医疗相关的大model开发,在金融行业 focus on 金融领域的应用研究,在商务行业 develop 涉及商务场景的大model技术,在交通行业 optimize 交通相关的智能算法。
杭州积极推动头部企业研发多模态通用大模型的关键技术;中小企业则专注于细分领域的专用模型打磨与优化。
2023 年以来我国各地出台的大模型产业相关政策





1.2 AI 大模型产业发展技术驱动力
近年来,在人工智能领域的大规模模型取得了快速进展。与此同时,在这一领域的主要热潮是由与语言相关的技术推动而成的。具体而言,在这一过程中构建的语言大型模型通过在海量无标签数据上实施大规模预训练过程,并在此基础上使该型能够在大量知识库中获取信息并执行指令微调操作;最终能够实现多任务场景下的通用求解能力。
在2017年时, Google提出了基于自注意力机制的神经网络架构——Transformer模型,为大模型预训练算法架构的发展奠定了基础。于2018年, OpenAI和Google分别发布了GPT-1和BERT两大语言模型,使得预训练大型语言模型在自然语言处理领域已成为主流方向。
在
1.2.1 Transformer 架构
该架构已成为当前语言大模型的主要架构形式,并于2017年经 Google 提出。其核心理念在于利用自注意力机制捕获输入序列的整体信息,并逐步将其传递至各层。该架构显著优势体现在高效的特征提取能力和并行计算能力上。
Transformer架构主要包含输入模块、多层编码块与解码块以及输出模块等基本单元结构。具体而言,在输入端部设置有文本嵌入子网络与位置编码组件;经过编码块的深度学习处理后,在解码端部通过多个解码块完成特征重建;最终在输出端部部署线性变换模块以及Softmax激活函数模块完成任务预测过程。
Transformer 架构图

自注意力机制充当着Transformer模型的核心组件角色,在处理序列数据的过程中使得模型能够通过分析序列中的每个位置的信息来生成综合的上下文表示,并通过加权汇总各位置的信息特征从而实现对整体语义的理解与捕捉
在自注意力机制中进行处理时,模型对输入序列执行线性转换操作,并生成三个嵌入表示:查询向量Q、键向量K以及值向量V。
然后是通过计算Q向量与K向量的点积,并随后使用Softmax函数来确定每个位置对应的自注意力权重值。最后将这些权重值分别与V向量相乘以生成最终的自注意力输出结果。
该架构通过多头自注意力模块来增强模型在信息表征方面的性能。其核心特征是能够同时关注多个不同的表示子空间中的信息。具体而言,该架构将输入序列划分为多个独立的子序列,并通过一组独立 learnable 参数对每个子序列进行线性变换以生成中间表示。随后,在计算自注意力时会综合考虑各子序列间的关联关系。各子序列生成的表示经拼接整合后,并经过全连接层处理得到最终输出。
经过自注意力机制的计算后,在处理输入序列时,Transformer模型通过其内部的前馈神经网络对其进行进一步变换。该神经网络架构包含若干个全连接层,并采用ReLU激活函数对各层输出进行处理。这些设计使得前馈神经网络不仅能够实现对输入序列的基本变换作用,并且能够通过非线性变换帮助模型捕获更为复杂的特征
1.2.2 AI 语言大模型关键技术
这些AI语言大模型的关键技术涵盖了基于人类反馈强化学习、指令微调以及模型提示等技术手段。
(1) 基于人类反馈强化学习
通过Reinforcement Learning from Human Feedback (RLHF)框架,在人工智能系统中融入了大量的人类标注数据,在这一过程中建立了与人类审美的高度一致的奖励机制。该方法不仅有效提升了语言生成的质量标准,并且显著增强了系统在复杂对话中的表现能力。
基于人类反馈强化学习具体包括以下几个步骤:
开发监督策略模型:采用监督学习方法对预训练语言模型进行开发,并通过赋予特定奖励和惩罚来引导AI模型根据输入生成相应的输出结果。
通过让标记员提供关于模型输出结果的反馈信息,并对模型生成的行为及其质量与准确性进行排序或打分以获得评分依据;这些评分信息将被转化为奖励信号作为强化学习中的后续奖励机制使用。
采用近端策略优化方法推进强化学习过程:首先利用监督学习技术构建一个PPO模型;随后基于奖励机制反推出最优结果后;再将所得结果应用于PPO模型参数的优化与更新。具体而言,在PPO模型的训练过程中;智能系统通过执行不同动作并依据每项动作获得的反馈信息来评估性能;该系统逐步演进其行为策略以提升整体效能。
基于人类反馈强化学习示意图

(2) 指令微调
指令微调 (Instruction Tuning) 作为一种促进语言大模型实现人类语言指令遵循的核心能力,在零样本学习方法的基础上,在未知任务上实现泛化的学习方法。作为零样本学习方法,在未知任务上实现泛化的能力。
通过这种技术设计思想,
使语言大模型能够根据人类给出的具体指令进行相应的理解和执行,
即在给定具体提示的情况下,
生成符合要求的特定回应。
可将指令微调视为有监督学习框架下的一个独特变种。然而它们的目标存在差异。标记数据辅助下进行的预训练模型优化过程旨在提升特定任务的表现能力。而通过与(指令, 输出)配对的数据集训练大型语言模型(LLMs),这是一种增强其能力及控制性的方法。其独特之处在于数据集的组织方式——即由人类发出的具体命令与预期结果一一对应的数据样本组成。
(3) 模型提示
通过大量文本数据预训练后的人工智能语言模型具备作为通项任务求解器的潜在能力,在执行特定任务时这些能力可能不会显式地显现出来;通过在大模型输入中设计适当的指令提示有助于激发这些潜在能力;这即被称为模型提示技术(Mind-DR)。典型的模型提示技术包括指令指示法与思维过程法两类主要方法。
OpenAI 在 GPT-3 中首次提出上下文提示,并发现 GPT-3 在特定领域少样本提示下能够达到人类水平的能力,在低资源场景下非常有效。指令提示的核心思想是避免强行引导语言模型适应下游任务的要求,并通过提供"提示(Prompt)"将数据嵌入额外的上下文信息以重新组织下游任务的目标描述和输入形式等关键要素,在一定程度上使它们看起来像是在语言大模型预训练过程中解决的问题。
Mindful reasoning prompts (Chain of Thought, CoT) are a methodological approach designed to facilitate structured and reflective problem-solving processes. The underlying principle involves systematically exploring diverse perspectives and integrating multiple analytical angles to enhance the depth and comprehensiveness of the reasoning process. By encouraging participants to engage in multi-step reasoning, it becomes possible to generate outputs that are not only logically consistent but also highly credible and evidence-based. Mindful reasoning prompts (Chain of Thought, CoT) have been widely adopted as a tool to enhance the interpretability and transparency of artificial intelligence systems by providing clear pathways for decision-making processes. These prompts guide language models to articulate their thought processes in a coherent and organized manner, much like how an individual would deliberate over complex issues through a series of thoughtful considerations.
在生成式AI系统中开发出能够执行复杂逻辑任务的能力被称为"涌现性推理"。从技术角度来看,在生成式AI系统中开发出能够执行复杂逻辑任务的能力被称为"涌现性推理"。这种 emergent reasoning capability 通常只有当模型参数规模达到一定水平时才能启用这种 emergent reasoning capability. 在训练阶段设计特定的任务来促进这种 emergent reasoning capability 的发展. 通过设计特定的任务来促进这种 emergeing reasoning ability 的发展. 在评估阶段则通过测试生成式AI系统的性能来验证这一特性. 在评估阶段则通过测试生成式AI系统的性能来验证这一特性.
1.3 中国 AI 大模型产业发展市场驱动力
中国AI大模型产业发展源自涵盖多个行业的广泛需求。如办公制造金融医疗政务等多个领域对降本增效生产自动化降低风险提高诊断准确率以及提高政务服务效率等方面提出了诉求。相关领域的创新和发展共同推动着中国AI大模型产业的蓬勃发展预示着未来更广阔的市场前景。
1.3.1 办公场景
近年来随着多种媒介处理能力的快速发展 大模型摇身变为工具或辅助者 赵入办公室与会议室 并结合现有技术 实现智能化
大模型驱动的智能办公产品能够满足多种日常办公需求,在案生成PPT美化以及数据分析等方面展现出显著的能力。仅凭自然语言交互即可让"助理"承担繁琐的文字处理演示制作及数据运算的任务。智能文档则辅助用户快速创建文章框架并提供一键式模板生成功能同时支持内容创作与表达优化在排版美化方面则由智能演示负责自动调整布局并生成演讲备注而智能化表格则可通过对话完成公式输入与数据批量处理等功能。
智能领域方面,在大会组织管理中,大模型具备多维度的应用价值和辅助功能。在大会组织管理过程中, 大模型能够辅助与会者进行多语种同声传译, 实现精准的信息传递; 同时, 在数据采集与整理阶段, 大模型能自动完成各项基础数据的收集与初步分析; 在会后数据分析方面, 通过建立完善的数据索引体系, 大模型能够快速提取关键信息并生成详实的统计报告; 在智能决策支持方面, 基于与会者提出的关键词, 大模型能自动规划整个大会的日程安排以及资源分配方案
在大模型能力的支持下,经验证同声传译的准确率、时效性和多语种支持均获得明显增强;经大模型系统处理后生成的会议纪要具有条理分明、重点突出的特点,在后续总结回顾环节可显著提高工作效率。
1.3.2 制造场景
人工智能技术的快速发展正在深刻重塑制造业领域的发展图景,在研发设计、生产制造以及供应链管理等多个环节均掀起了一场变革浪潮。借助大模型技术与EDA/CAE/CAD系统的深度结合,在提升传统研发设计软件效率的同时也带来了显著的效果提升效果水平显著提升效果显著提升效果显著提升效果显著提升效果显著提升效果显著提升效果显著提升效果显著提升效果显著提升效果显著提升效果显著提升
在产品研发与设计阶段(例如采用大模型与EDA结合的技术方案),借助云端计算资源的扩展性实现了智能化的设计自动化流程,并且确保了电路系统的精确性和可靠性的同时优化了整体的设计流程与系统架构。从而帮助企业显著缩短产品开发周期并降低研发成本的同时提升了市场竞争力;借助人工智能生成器(AIGC)和数字孪生技术平台能够模拟真实生产环境下的作业场景,并通过智能虚拟人物替代人工操作者进行危险性评估与故障排查工作或者采用仿真设备模拟实际操作场景进行沉浸式培训教学过程
该机器人配备大模型系统,基于机器视觉技术,可完成路径规划与物体识别两大核心任务;该系统被整合到供应链管理系统中,能够重塑数字办公室的工作流程,通过AI驱动的人工智能数据处理与可视化呈现,不仅帮助企业在管理决策过程中更加高效精准,还能在数据应用层面显著提升运营效率;同时,该系统还具备实时监控市场需求的能力,能够在第一时间发现潜在的需求变化并优化资源利用效率;此外,AI系统能够进行智能调度、实时跟踪物流节点状态,并在关键节点发出预警信息以预防可能出现的问题。
1.3.3 金融场景
金融行业被划分为前段、中间和后端业务模块,在数字经济时代的大背景下,在这些模块中应用大模型技术实现了整体效能提升。以银行为例,在其各项金融服务中都部署了对话机器人与虚拟助理等智能辅助工具。具体而言,在个性化服务领域中基于客户数据信息量身定制财务方案与产品组合;在电子营销方面则通过分析客户的活动模式设计并发送定制化电子推广材料;在金融欺诈检测环节中运用大模型技术对海量数据进行深入分析以识别潜在异常行为;而在信贷支持领域,则整合丰富的生活场景与信用信息资源通过详尽的数据分析结果来协助制定优化信贷策略从而有效降低相关金融服务中的潜在风险损失
1.3.4 医疗场景
得益于近年来医疗大模型的持续优化与创新突破,在复杂的数据分析领域取得显著进展。鉴于患者行为数据的独特属性与个性化需求之间的矛盾关系,在此基础上构建了定制化方案以满足患者"个性化的服务需求"。该技术体系在智慧影像处理方面实现了断层扫描(CT)、磁共振(MRI)等场景的应用覆盖,并显著提升患者病情评估的准确性;同时为手术规划与风险评估提供可靠的技术支撑;此外还形成了以智能健康管理为目标的小程序辅助平台,在日常诊疗中为患者提供精准导诊服务与个性化健康管理建议。
1.3.5 政务场景
在办公场景、制造业、金融领域以及医疗行业等场景中得到了相应的支持与应用。与此同时,在政务领域中所面临的数据处理压力、信息传播风险以及工作流程优化等方面的痛点问题也得到了大模型技术的支持得以有效解决。通过自动化政策检索与政策比对技术的应用,在减少人工分析与比对的工作量的同时实现了海量政策文件的检索与比对功能;通过引入权威白名单机制整合政策数据资源,并接入全面的政策数据库系统,在防止来自不可靠信息源的干扰方面取得了显著成效;通过建立和完善政策经验知识库体系,在促进政务业务的理解能力与决策效能方面形成了完整的知识支撑体系;通过规范化生成与检查功能的应用来确保生成内容的规范化程度及权威性。
第二章 百舸争流:中国 AI 大模型产业现状及典型案例
2.1 AI 大模型主要特征
AI 大模型具备跨领域应用能力、能够广泛应用于不同领域的特性以及不仅能够适应特定领域的要求,并且能够自主学习并生成新的知识或技能这一系列特点。
基于 ChatGPT 的人工智能大型模型系列凭借拥有巨额参数与深层神经网络架构,在应对复杂任务时展示了卓越的自然语言处理能力以及意图识别能力;同时具备推理与内容生成等多种核心功能;该系列模型不仅能够学习识别更多样的特征与模式,在实际应用中还展现了强大的通用性问题解决能力,并被视为通向通用人工智能的关键途径
AI 大模型的三大特征:泛化性、通用性、涌现性

2.2 AI 大模型主要类型
根据部署模式将AI 大模型划分为云端类和终端类两大类,在云端运行的云侧大模型具备更高的参数规模、更强的计算能力以及庞大的数据存储量的需求;而被部署于手机及PC等设备中的端侧大模展现特点为较小规模的参数数量、本地运行的优势以及增强的数据隐私保护功能。
具体而言,在云计算环境下存在两类主要的大模型架构:通用型和行业专用型;而端点设备的大模型则主要包含手机端与PC端两大类架构。就云侧环境中的通用型架构而言,在设计时充分考虑了广泛的适用范围,并通过整合来自不同领域的训练数据来实现对各类应用场景的有效支持,在应对不同类型的作业方面展现出较强的适应性和灵活性。
行业级的大模型展现出专业性特点,在各行业中根据具体需求展开训练,并从而在相关领域积累了更为深入的专业知识与应用场景经验。端侧的大模型方面,在设备终端直接部署使得用户体验更加个性化与便捷;其中手机和平板电脑作为终端设备的主要载体
AI 大模型主要分为云侧大模型和端侧大模型两类
当前我国 AI 大模型产业展现出蓬勃发展的态势。伴随着多家科技厂商推出的大规模AI技术应用落地商用进程不断推进,在金融、医疗及政务等多个领域中应用的这些大模型已逐渐成为提升服务质量与效率的关键工具。
我国具有代表性的一类通用 AI 大模型主要包括科大讯飞的讯飞星火认知系统等实例;而行业级 AI 大型语言处理系统则涵盖蜜度的文心-小红书版AI基础认知系统、容联云的赤兔大语言处理系统以及用友网络 YonGPT 专业版;此外,在端云架构下兼具云侧与端侧计算能力的大规模AI基础认知系统主要有 vivo 的蓝智全场景智算引擎;最后,在端侧计算领域以蔚来的 NLP 专业级开源基础预训练语言模组 NOMI GPT 作为主要代表
中国 AI 大模型分类及典型案例

2.3 中国 AI 通用大模型典型案例
案例一:科大讯飞—讯飞星火认知大模型
(1)大模型简介:
科大讯飞推出了"讯飞星火认知大模型"这一新一代人工智能系统;该系统不仅具备自然对话功能以实现用户需求理解与任务执行;而且聚焦于提升人机交互效率;助力知识获取与内容生成;增强数字化和智能化协作效能。该认知智能系统主要涵盖以下七项核心技术:文本生成能力;语言理解能力;知识问答系统;逻辑推理引擎以及数学计算模块等
(2)大模型优势:
在2024年1月正式发布的新版本中
讯飞星火认知大模型 V3.5 七大能力

讯飞星火认知大模型 V3.5 着重从三个维度展示了模型能力的显著提升,并为其在数智化时代提供了强大的技术支持。该系统不仅助力人类与智能设备实现更加自然便捷的交互体验,在知识学习与内容创作领域也取得了突破性进展;此外,在提升数智化生产力方面表现出色。具体而言,在人机交互方面,讯飞星火 V3.5 拥有出色的人工语言理解能力和指令执行能力,并且在多轮对话中展现出良好的协作效率;同时,在情绪感知和情感表达方面也达到了较高水平;在知识学习与内容创作方面,则通过强化基础数据处理能力和智能问题生成技术的进步,显著提升了相关领域的智能化水平
该系统能够通过整合外部知识实现广泛延伸;在数智化生产力方面,在逻辑与空间推理方面具有同等重要性;数学作为大模型的核心能力不可忽视;此外用于构建连接虚拟与现实的工具;多模态技术则成为机器人、工业及家庭场景中的必备技能;讯飞星火 V3.5 在关键技术领域取得了显著进展
(3)大模型应用:
讯飞星火七大能力的提升,实现了各类应用场景性能升级。
在语言理解过程中,在情感分析方面能够识别出信息并提取出关键特征以便更清晰地掌握内容的观点与态度。对于文本摘要而言,在简洁明了且精准的信息总结的基础上能够迅速掌握文章的核心观点以及主要论点
文本生成方面,科大讯飞推出了首款能够一键快速自动生成文档和PPT文件的办公应用——讯飞智文系列软件。该产品集成了多项核心功能:包括支持文档快速生成、具备AI写作辅助功能、支持多语言文档生成、提供智能图片自动配图服务、允许选择多种模板设计风格以及能够用于制作演讲提纲等多种实用用途。
在知识问答领域中,讯飞星火擅长于生活常识问答、医学知识问答以及政策问答等各类任务。
在逻辑推理领域中,在考察问题的前设条件与假设情况时能够推导出解答方案或创新思路。而科学推理则主要承担着基于现有数据与信息进行推断、预测以及验证等活动的基本研究职责。
在数学能力领域中,在处理各种复杂的数学问题方面具有显著的能力
在开发效率方面,讯飞星火展现出出色的能力,在注释与函数名的基础上具备智能化的开发辅助功能;该系统不仅能够自动生成相应的代码,并且还提供了详细的逐行代码注释功能;不仅能够精准识别并定位代码中的语法错误和逻辑问题;此外,在检测到潜在问题时还能自动生成相应的单元测试用例。
多模态能力方面,在讯飞星火中可以通过用户的图片上传获得相应的图片描述内容;同时也能回答与图片素材相关的问题;此外,在用户的文字描述基础上还能生成预期的音频与视频内容。
案例二:百度公司—文心一言大模型
(1)大模型简介:
百度开发的文心一言是一种人工智能大语言模型产品,在多个领域展现独特价值。该系统不仅具备跨模态及跨语言的深度语义理解和生成功能,在文学创作与文案撰写等多个领域均能提供高质量的服务支持。其核心优势在于掌握理解功能的同时能够有效完成多维度的任务处理,并通过强大的推理能力和长期记忆来提升整体效能表现
(2)大模型优势:
2023年10月推出的文心大模型4.0相较于前一代产品实现了显著的技术进步,在多个核心功能上都有所优化与增强。具体而言,在逻辑能力上的提升幅度较上一代提升了约3倍,在记忆能力上的提升幅度则是约2倍。
理解能力方面,在文心一言系统中能够解析潜台词信息、处理复杂语法结构以及识别行业术语;其不仅具备分析多样化的提示指令的能力,在处理代码理解及问题排查方面同样具备很强的能力。
在生成多样性方面,文心一言表现出色,在多种场景下都能提供高质量的内容输出。该系统不仅支持文字内容的生成,并且能够快速产出多样化的创意作品如图片设计与视觉化方案(包括图表与流程图)。此外,在编程辅助写作领域也展现出强大的适应性能力,并非仅限于代码编写功能。
在逻辑能力方面上,文心一言能够帮助用户应对复杂的逻辑问题、棘手的数学运算、关键的职业或生活选择、程序调试以及日常推理逻辑;同时也能进行系统性逻辑验证和立体几何问题的处理,并提供辩论策略支持等服务。
在记忆力方面,在多次对话中文心一言能够准确地记住对话的重点,并在处理复杂问题时表现得游刃有余,在沉浸式体验角色对话中展现出卓越的能力
文心大模型 4.0 的能力提升源自相关举措:
基于万卡计算能力,在飞桨平台之上依托集群基础设施与调度系统协同运作,并结合飞桨框架所具有的软硬件协同优化机制,在保障了大模型训练稳定性的同时实现了大模型训练过程中的高效性
基于建立多维数据架构, 使该系统能够实现从数据分析与挖掘、特征构建与合成, 到结果评估与反馈的整体流程, 并大幅提升了数据使用效能, 显著增强了模型性能。
(3)利用有系统的参数微调、偏好学习机制以及强化学习算法等技术手段进行多级配准过程设计,在提升模型性能的同时实现了更好的与人类判断体系的一致性。
采用可再生能源驱动的训练方法,并结合参数优化策略进行增量式调整،大幅降低了训练资源消耗及所需时间成本,并显著提升了模型迭代速度
文心大模型 4.0 典型特征

(3)大模型应用:
文心大模型已在一个广泛的领域范围内实现应用,并涵盖文学创作、文案生成、搜索问答、多模态生成以及数理逻辑推算等功能性服务为用户提供
在文学创作领域中
在商业领域中进行文案创作时,在线AI工具如文心一言能够协助完成包括商业计划书、市场分析报告在内的多种专业性文案写作任务,并为企业提供有力的文字支持。通过激发用户的创意思维能力,并结合专业化的写作功能助力企业广告创意人员快速制定出具有吸引力的广告文案与宣传语方案;从而帮助企业广告人员迅速制定出具有吸引力的广告文案与宣传语方案;该系统不仅能够辅助撰写高质量的专业性文案内容,在提升工作效率的同时也为企业节省了大量时间成本。其核心优势在于激发用户的创意思维能力以及为其提供创新性的创意支持与资源辅助。
在问答系统方面,该聊天机器人依托先进的自然语言处理技术(文心一言),支持用户进行自然语言对话,并准确识别用户的意图与需求。它不仅能够针对用户提出的问题提供精准的回答与有用的建议,在多个应用场景中都能发挥出色的作用;这种智能服务模式可用于多个领域如生活服务、教育辅导以及客户支持等。
多模态生成方面,文心大模型能够处理图像生成与编辑,并根据用户需求生成所需图像或修复现有图片。此外它还支持语音合成以及相关技术的应用包括语音识别和音频分类。文心大模型不仅具备视频数据处理能力还能将文本转化为动态图像序列来完成视频分类与目标检测等任务;
在数理逻辑推理方面,在人工智能领域中存在一种强大的工具——文心大模型。它不仅能够有效解决复杂数学问题,并且还同时具备代码开发辅助能力。例如,在百度的研究团队中基于文心大模型开发出了一个名为Comate的智能代码助手系统。该系统通过整合多种功能模块实现了智能化运作:包括智能推荐、智能生成以及智能问答等功能,并且支持多种编程语言以及集成开发环境IDE的应用。
案例三:阿里巴巴—通义千问大模型
(1)大模型简介:
通义千问由阿里云开发的一款预训练语言模型,在先进的人工智能技术基础上具备理解和解析人类语言、图片以及文档等功能。该模型在创意文案生成、办公辅助、学习支持以及趣味生活互动等领域为用户提供多样化的交互体验。
通义千问具备中英文理解、数学推理、代码理解等能力。
(2)大模型优势:
2023年10月, 千亿级参数的大模型通义千问v2正式推出,相较于v1版本,该系统在复杂指令的理解能力、文学创作能力、数学基础的通用性、知识存储与检索能力以及对幻觉的抵御能力等方面均实现了显著提升
中英文理解能力构成了大语言模型进行理解和表达的基础核心能力,在这一领域内,通义千问 2.0 挑选了MMLU指标(由伯克利大学、哥伦比亚大学等多所知名高校共同发布)并获得了82.5分的成绩;同时,在中文任务领域内,通义千问 2.0 在经过海量中文语料的学习后,在C-EVAL测试集上实现了最佳成绩。
数学推理方面,在GSM8K测试中(由OpenAI发布的儿童数学测试集合),通义千问位居第二位,并展现了卓越的运算能力和强大的逻辑思维能力。
在代码理解能力方面进行评估测定时发现HumanEval(由OpenAI发布)作为基准测试工具被用于测定大模型对代码片段的理解与执行能力,并基于该评价体系通义千问系统的表现位列前三名。此能力则成为大模型在编程辅助及自动代码修复等应用场景的基础支撑。
通义千问 2.0 参数及指标评测

(3)大模型应用:
通义千问目前主要服务于四个领域:创意内容、行政支持、学习辅助以及休闲娱乐。
创意文案涵盖的应用领域包括:专业的营销文案撰写服务;通过输入产品介绍信息可获得量身定制的专属营销方案;针对用户提交的文章提供系统化的优化建议;帮助提升写作技巧并完善整体表达效果;专业的直播带货脚本创作服务;整合商品数据与用户画像为电商主播打造趣味性强且具有商业价值的直播内容;
办公助理这一应用旨在帮助用户进行系统化的战略决策支持。通过‘SWOT分析’系统全面地分析内外部环境的影响因素,并从多维度评估特定项目所处的具体环境条件。此外,在‘PPT框架生成模块’中, 通过智能化算法设计出符合专业需求的PPT框架结构
包含有《题目加工厂》,该平台基于专业的学科知识与领域背景生成高质量的试题,并有效减少了教师、家长及教育机构在出题时间上的投入与压力。此外,《学习规划平台》能够为用户提供个性化的学习路径规划服务,并帮助用户制定科学合理的学习时间表。
趣味生活领域内存在多种特色创意类应用:如“会放飞的菜谱”这类项目。通过输入具体的菜肴名称可以获得详细的烹饪步骤说明。“AI 健身教练”这一功能能够借助AI技术开发出的专业健身指导系统能够为用户提供个性化的运动计划。“write lyrics”则根据用户的提示歌词名称生成富有表现力的艺术性歌词内容。
2.4 中国 AI 行业大模型典型案例
案例四:容联云—赤兔大模型
(1)大模型简介:
赤兔大模型是由容联云专注企业级应用的垂直行业多层次大语言模型,在助力企业构建专属智能客服系统的同时实现数智化营销策略。该模型通过整合丰富的一线智能应用能力实现了从降成本增效到创造价值的关键转变。具体而言:
- 通过深度对话分析为企业提供专业的服务用语支持
- 结合AI知识库构建高效的问答体系
- 提供智能化的知识运用方案
- 基于data analysis优化整体运营效率
- 配备AI智能对话框架以提升客户交互体验
- 采用业务流程优化方案实现精准运营
(2)大模型优势:
赤兔大模型三个核心点分别是智能性、可控性和投产比。
智能化水平是客户最为关注的重点,在首要考虑的因素中应当重点评估技术实力是否足以全面覆盖现有需求的基础上
智能性方面,包括检索增强、会话分析、逻辑推理、数据分析。
检索增强是指在海量文档中快速定位到信息,经过整理给客户提供答案。
会话分析有助于模型在对话中发现多维度信息不仅包含情绪、立场方面的信息以及各种细节的意见,并且能够根据不同业务迅速转换到相应的业务场景中
逻辑推理体现在推荐话术的原因,投诉、预警的原因这种因果分析能力。
数据分析涵盖了更为深入且机械化的分析手段,并降低了技术人员和业务人员在数据层面的操作。
在可控制性层面来看,赤兔大模型通过实现了道德与伦理的一致,确保了安全边界的同时,还能够根据对话内容调整生成的风格与偏好,从而达成在特定场景下的稳定输出。此外,通过明确告知模型处理的知识范畴与知识边界,有效规避了自由对话可能带来的潜在安全隐患和资源消耗问题
在投产比方面的大项目中,默认情况下大型语言模型展现出强大的效能得益于规模庞大的训练数据支撑;然而这个投入往往伴随着巨大的资源消耗;因此确定是否每个场景都必须依赖大型语言模型是一个关键决策;在AI底座的设计理念中我们并未放弃小型语言模型而是通过优化内部资源配置来协调各环节的任务执行;具体来说通过优化内部资源配置来协调各环节的任务执行机制实现了上下层功能的有效协同:例如在某些环节大型语言model承担着线下或离线任务而在其他环节则由大型language model去调度并指挥小型language model共同达成高层功能的需求
(3)大模型应用:
基于赤兔大模型,容联云发布了生成式应用“容犀 Copilot”。
容犀 Copilot具备三大核心能力:大模型话术、智能知识库、会话洞察。
大模型话术:容犀Copilot后台提供一键快速核对及筛选功能,在保证质量和数量的基础上提取高效率的对话方案,并通过深入分析业务痛点识别客户关注的重点问题。
智能知识库:为企业提供从零开始的对话库搭建服务,并包含文档理解能力、快速检索和专业对话系统等功能。
会话洞察:通过高效便捷的方式了解每通会话的沟通情况,并深入分析客户需求;回归至实际业务本源后运用容犀 Copilot 深入探索金融行业细分领域,在此基础上打造专门针对不同细分领域的客服工具——例如分期挽留助手、荐卡挽留助手以及投诉安抚助手等。这种实时提供快速响应客户需求的服务能够生成更适合应对客户需求的语句,并根据客户情绪的变化趋势提供相应的评估与提醒措辞及注意事项
容犀 Copilot 产品应用场景

案例五:蜜度—文修大模型
(1)大模型简介:
文修大模型是一款由蜜度公司为其专业领域量身打造的专业级大语言模型,在智能校对领域展现了卓越的技术实力。凭借蜜度在智能校对领域的深厚积累与实践经验,该款产品能够精准满足政务单位、新闻媒体、企业机构以及各类出版机构等各类机构在日常工作中面临的校对需求,提供高效便捷的服务体验。
专业的大语言模型在多个方面表现出色:校对效率高且准确性强;处理速度极快;匹配精度高且适应性强。它在垂直领域能够提供精准高效的服务。
(2)大模型优势:
在数字时代浪潮中, 内容创作与传播的速度令人惊叹, 信息传递的精准度对公众至关重要. 蜂度文修大模型凭借卓越的校对能力、高效的处理速度以及精准的匹配机制, 在复杂环境中游刃有余地应对挑战. 在校对能力方面, 蜂度文修大模型基于拼写错误、语义错误及语法错误的基础, 采用27个细分类别作为评判标准, 全面覆盖出版行业及新闻行业的"三审三校"规范需求, 提供广告法检测、常识校我对等全面服务. 在处理效率上, 蜂度文修大模型仅需几秒钟即可完成一篇千字文稿的全面校对, 几分钟则能完成一本10万字书稿. 这种高效的工作模式源自持续不断的学习与适应能力.
(3)大模型应用:
大型文本修正模型能够覆盖政务单位、新闻媒体、企业单位及出版机构等多行业场景的应用需求
在政务领域中,赋能各级政务部门实现流程智能化,提供文字材料的内容审核与优化建议,搭配修改指导及文本美化服务,致力于确保内容的准确性和严谨性,支持内网环境下进行校对工作,以满足更高的保密要求.
在政务领域中,赋能各级政务部门实现流程智能化,提供文字材料的内容审核与优化建议,搭配修改指导及文本美化服务,致力于确保内容的准确性和严谨性,支持内网环境下进行校对工作,以满足更高的保密要求.
新闻媒体领域中,文修大模型深入挖掘新闻媒体工作的各个方面,对不同类型的 media 内容进行 sensitive content validation, assist in rapidly identifying existing issues and highlighting key problems, ensuring content becomes more systematic and standardized, effectively maintaining the public's trust in official accounts; simultaneously providing professional text optimization services to significantly improve the processing efficiency of submissions and ensure timely news reporting.
在企业单位领域中,在从全流程角度切入企业的办公场景时,在内容纠错开始,在多个方面进行优化,并进一步提高文本的质量;精雕细琢地优化宣传内容,并增强文案的吸引力;切实推动营销效果的显著提升。
教育机构领域内对宣传材料、新媒体稿件以及科研报告等具体内容进行系统性校对工作能够有效地提高文字质量水平并确保内容的科学性和规范性
通过 AI 润色功能助力文章、报告、材料的起草、优化工作,有助于进一步提升学校传播力、影响力;出版机构领域,提供专业、便捷、高效的内容筛查及文字质量把关服务,协助各出版机构高效处理多语言文本,降低内容差错概率,保障内容的规范性、准确性。
案例六:用友—YonGPT 大模型
(1)大模型简介:
YonGPT 以友为基础,在数字技术与智能服务的基础上为企事业单位提供了数字化转型解决方案的大模型。其在企业服务领域的主要应用场景涵盖以下四个维度:智能化提升业务运营效能、自然流畅的人机交互体验、通过智慧技术优化知识管理流程以及利用语义分析赋能应用场景。
YonGPT 企业服务大模型整体架构图

(2)大模型优势:
用友人工智能研发团队依托海量的商业应用数据进行研究,在深入分析企业应用场景的同时融合了行业专长构建了大量企业服务语料库并将其转化为高质量的企业服务大模型训练素材库。随后将专业知识与行业见解融入其中从而有效提升了YongPPT的能力水平使其在专业性实用性及技术领先性方面均达到了新高度
YonGPT 通过上下文记忆增强大模型的知识存储能力,在知识库表索引的基础上构建适应应用场景的知识体系;同时采用Prompt 工程提升指令处理效率,并通过 Agent 执行实现智能决策;此外还整合了通用工具集以增强多模态处理能力;最终构建出一套完整的企业服务大模型体系;该系统不仅提升了训练效率和运行成本还集成了一系列先进的开发工具和技术方案;通过自有的数据管理机制实现了对海量数据的高效处理;基于大模型的精调算法进一步优化了模型性能;建立了完善的评估体系以确保模型质量的同时支持大规模推理功能;并通过插件服务拓展了其在不同领域的应用场景从而为整个大模型系统提供全方位的服务支撑。
(3)大模型应用:
用友企业服务大模型 YonGPT 聚焦于四个核心方向深化模型训练与产品效果优化,在客户业务前端深度融入全部价值链与多维度场景中实现泛在智能与群体智能应用。
在智能化业务运营方面:YonGPT 被数据驱动分析和预测模型所支持,在全面了解企业运营的基础上识别出潜在的问题与机遇,并提供智能应对措施以提升经营决策质量与业务运营效能;
在推动人机交互天然化方面:YonGPT赋能于强大的自然语言处理技术和卓越的理解能力,在这一过程中实现了企业级应用与服务之间的顺畅自然对话交流。采用以人为本的方式,在不同领域间实现了功能调用、系统连接以及模块搭建,并最终能够更加顺畅且高效地完成各项任务。
智慧化领域中,YonGPT 靠支大量的数据资源与信息网络,依靠先进的算法与技术,实现了对已有知识的有效提取与整合。并不断创造出新颖且有实用价值的知识内容,并提供了行业解决方案与专业知识交流的平台。同时,该系统充分挖掘企业自身的资源库,为其提供专业的支持服务,助力企业和用户能够充分挖掘自身潜在的能力优势,并推动专业知识的有效传播与实际运用
针对语义化应用的生成:YonGPT 基于对用户需求、企业业务和数据特征的解析,具备自动生成具有语义化能力的应用程序的能力,并能全面提升企业个性化应用服务的生成效率。
此外,YonGPT在智能化场景服务领域提供了四种具体的服务:其中一种是企业收入/利税经营智能分析系统,在线实时监控经营状况,并迅速识别问题所在;另一种是精准预判企业收益水平的服务模式;第三种是通过数据预处理及时预判应对变化策略;第四种则是利用先进算法优化运营效率提升效果。
该系统集 years of supply chain management experience, leveraging its 'interactionally innovative' order generation assistant to achieve efficient intelligent single-order generation and significantly enhance operational efficiency.
帮助企业在招聘过程中高效精准地识别和定位目标人才;借助专业的AI技术对简历进行智能匹配筛选;通过动态化的场景模拟和个性化的面试指导优化应聘者的求职体验;从而实现选才、用人决策的精准化和规范化;
智能化搜索引擎带来沉浸式的全新体验,在助力企业知识价值的高效转化的同时也不可忽视用户需求的关注,并实现了搜索与推荐功能的有机融合。让知识真正赋能于业务与组织。
案例七: “写易”智能创作引擎
(1)大模型简介:
"write-easy" intelligent creation engine is a specialized AI writing tool launched by People's Republic of China's21st Century Media. Built on its core values-oriented large language model, it undergoes targeted optimization for specific application scenarios. This platform is designed to cater to the needs of public institutions such as government agencies, state-owned enterprises, hospitals, and schools, as well as individual writers and content creators who require regular reading and writing services. By offering comprehensive professional solutions through advanced numerical intelligence and continuous updates, "write-easy" effectively enhances the information fluency and creativity of its users.
“写易”智能创作引擎产品架构

(2)大模型优势:
该系统通过充分了解用户需求, 开发出了"随查""随写""随审"三种交互模式, 并具备高效创作的特点:能够快速满足用户的各种需求;同时确保操作的安全性和准确性;还能生成丰富多样的内容。
其主要功能有:高效的智能创作系统:该系统基于海量权威数据资源库,在结合检索增强辅助技术的基础上实现了辅助生成能力的创新性提升。根据标题快速生成高质量的核心内容,并结合标题内容及观点分析帮助用户生成更具相关性和准确性的新鲜素材;从而显著提升了用户的写作效率;
专业的涉政内容审校:
原文引用检测:审查文本引用情况,并评估引用是否符合规范。同时提供相关来源信息。
规范性文字审核:全面审核领导人的讲话内容、国家重大的政策文件等文本实施规范化把关
3.人物信息审校:对文本中出现的人物姓名及职务信息等进行勘误检测。
核心信息审查:识别文本中标志性和代表性重大事件以及关键人物和敏感信息的存在
- 基础纠错:涉及对文本中的错别字识别以及标点符号错误校正工作;其中涵盖中文标点错误的识别和英文拼写问题。
拥有丰富写作素材的内容库结合人民网及人民日报的强大资源整合了全面且详实的信息资源从时间维度出发并对信息按内容类型进行分类整理形成了多维度的信息管理体系包括但不限于图文音频等多种表现形式每天同步精选报道并实时更新优质标题与佳句为用户提供便捷优质的写作参考服务
(3)大模型应用:
基于人工智能技术开发的智能化写作引擎"writeAI"
基于客户数据库进行定制化服务的"写易"智能创作引擎设计,在具体实施过程中主要以行业客户的语料库为基础,《人民日报》作为重要参考媒体的内容则作为辅助资源运用。该系统通过根据客户需求定制训练方案的方式实现对"写易"智能创作语言大模型的针对性培养,在提升专业写作水平的同时也能有效丰富素材储备并规范表达方式。在实际创作过程中不仅能够为标题撰写提供丰富的灵感资源还能支持修辞手法的多样化运用以及诗文引用等多样化需求,并通过网言网语等现代语言形式进一步拓展创作思路。系统会自动整合这些优质资源从而为创作者提供全方位的灵感支持与内容生成服务实现智能化创作保障工作流程的高度自动化与高效性。
2.5 中国 AI 端云结合大模型典型案例
案例八:vivo—蓝心大模型
(1)大模型简介:
蓝心系列大模型是首个实现于智能手机端并由公司自主研发的大模型系列;同时专为中文用户设计的开源型自研大型语言模型;涵盖三个数量级:十亿级别至千亿级别的大型语言模型;包括1号至5号五款不同规模的自研大型语言模型:分别是1.0B(十亿)、7.0B(七十亿)、7.0B(七百亿)、13.0B(千 three百一十亿)和17.5B(一千七百五十亿)。
随着参数的提升, 蓝心大模型逐步具备包括文本总结在内的多项核心能力, 如语言理解、文本创作、知识问答、角色扮演、复杂逻辑推理以及多样化的【复杂任务编排等专业功能. 依托蓝心大模型的能力, vivo成功开发出了定位精准的小型智能设备——蓝心小V 和功能丰富的大屏手机——蓝心千询
vivo 蓝心大模型矩阵

(2)大模型优势:
1)矩阵化优势
vivo 大模型矩阵不仅包含不同参数量级的架构选择以及多样化的部署方案,并能在多种应用场景下提供良好的支持,在兼顾用户的使用体验的同时提升其推理能力,并且能够有效减少端侧部署时运行所需的资源消耗
10亿参数的蓝芯大模型(一-billion-parameter),专为端侧应用场景设计的专业文本生成系统。该系统具备基于本地化的文本摘要功能以及图像风格化生成能力,在支持快速实现本地摘要功能的同时还能实现生图服务。
七十亿参数的智能云算心(7B)模型,则是专为手机设计的端云双向应用,在具备良好的语境关联能力和任务拆分能力的前提下,在语言理解与文本创作等多个应用场景中表现出色;该款7B版本同样也是手机行业首个开源的大模型,并实现了AI普及的目标;
拥有700亿参数的蓝心大模型(简称70B),主要应用于云端服务领域,并在角色扮演与知识问答等多种应用场景中展现出色性能。该模型既能实现智能涌现又能兼顾性能与成本。
面向复杂任务, vivo也开发了两款拥有千亿参数的大型语言模型, 分别包含1300亿和1750亿个参数的大规模预训练语言模型, 基于更大的知识库来实现更为专业化的交互体验
2)端侧优势
在移动端平台上有良好的表现的蓝心大模型系列包括1B和7B版本。它们能够充分显示其快速发词、占用内存少、全天候运行以及安全稳定的端侧运行能力。
出词速率高:vivo 对手机端的1B模型进行了优化工作,在经过测试后显示其最大输出速度达到每秒60字;这一速度远高于人眼通常能处理的速度范围(约10-20字/秒)。
内存消耗过高:vivo 的小型化优化后的小型模型在手机端运行时遇到的问题, 蓝心大模型 1B 和蓝心大模型7B分别采用仅需占用1.3G和3.8G手机内存的方式。
在任何时间点:部署蓝心大模型于终端设备上能够降低数据延迟,并且在出差飞机、高铁等无网络或低网络环境下也能支持大模型的应用需求;从而使得一些应用能够在全天候正常运行。
真安全:vivo 开发并部署了一种端侧内容安全过滤机制,在优化输入材料的质量以及大模型生成内容的合规性管理方面取得了显著进展。该技术通过本地处理数据实现了完整的处理闭环,并降低了敏感数据在网络传输过程中的泄露风险。这一创新举措为其在移动终端上的广泛应用提供了坚实的保障基础。
3)算法优势
蓝心大模型拥有三大核心算法优势:强大的基础支撑能力、精准响应指令的能力以及明确的价值导向。
首先,强大的基础能力是大模型的根基。
在预训练阶段中使用最前沿的Transformer架构。通过优化注意力机制和位置编码等关键模块。应用了先进的混合精度计算和梯度缩放技术以缩短训练周期。
其次,精准的指令跟随是大模型与用户交互的核心。
vivo 在微调过程中采用了"目标唯一损失"的方法,并通过基于聚类的技术对指令进行了相应的优化处理,从而进一步提升了模型的整体性能水平。
第三,正确的价值取向是大模型的灵魂。
在强化学习阶段中
(3)大模型应用:
蓝心小V是在OriginOS 4系统中集成了一款全局辅助功能,在这一平台上实现了智能语义搜索、强大的智能问答系统以及多维度的知识服务功能
超能语义搜索:通过日常语言即可在手机中检索照片、文档和日程等信息;
超能问答:当用户上传文件时,系统会迅速生成文件摘要,并支持基于文件内容直接进行快速问答;此外还支持开放式的知识库问答模式。
超能语义搜索:通过日常语言即可在手机中检索照片、文档和日程等信息;
超能问答:当用户上传文件时,系统会迅速生成文件摘要,并支持基于文件内容直接进行快速问答;此外还支持开放式的知识库问答模式。
超能写作:基于用户的要求,结合 AI 能力给用户生成文本,如润色、扩写、总结、格式文本等;
- 二维生成与图像重建技术:根据用户提供的文字描述或上传的图片,实现目标图像的生成。
- AI辅助行人消除:提供包含行人的原始图像后,在线使用对话系统进行行人识别与去除操作,并输出更加干净清晰的图像。
超能智慧交互:
1)智能识屏服务模块:
支持快速识别屏幕上的文本与网页链接,并获取关键数据;
2)直观且便捷的交互模式:
提供多样化的互动方式包括语音指令(语音输入)、键盘输入以及触控操作等。
2)蓝心千询
vivo 以蓝心大模型为基础构建出全天候的AI私人智能助手——蓝心千询, 该产品涵盖AI对话应用与AI灵感应用两大核心应用场景。蓝心千询标志着手机行业首个公开提供免费的大模型版本的应用程序。
对话系统模块中包含支持实现"超能问答"和"超能创图"两大核心功能。通过对话系统模块中的AI功能实现包括文本交互查询(Text Interactive Query)、开放性问题解答(Open-Ended Query)以及基于文档的知识检索(Knowledge Retrieval)。此外,在创作诗歌方面,在AI绘画领域,在编写歌词方面,在撰写活动方案或项目标题时……蓝心千询都能提供相应的支持与解决方案。
蓝心千询内置了智能灵感引擎,在内容创作工具中集成了多种功能模块
第三章 大浪淘沙:中国 AI 大模型产业发展所面临的挑战
3.1 大模型产业遭遇算力瓶颈
随着 AI 大模型规模呈现指数级增长,训练大模型越发依赖高性能 AI 芯片。
AI 大模型的训练速度与产出质量与计算能力之间有着紧密的关系。在训练像 GPT 这类大型语言模型(LLM)时,对计算能力的要求更为苛刻,并直接关联于其智能水平的提升。目前而言,在主流 AI 大模型的训练过程中,广泛应用于英伟达 A100 和 H100 等高性能 AI 加工器芯片上。
例如以ChatGPT为例,微软 Azure 云服务为其配置了 一万枚英伟达 A100 GPU。这些算力正是普遍认为大模型的门槛。
目前仅有少数企业拥有超过 1 万枚 GPU 。多数单体 GPU 的性能远逊于英伟达 A100 。因英伟达 A100 级别及以上的专用GPU被列为 restricted items ,中国相关企业现阶段无法获取此类硬件 。替代方案主要为英伟达 A800 系列专用GPU ,但该系列同样面临供应短缺和价格虚高的问题。
近年来我国自主研发的AI芯片显示出了强劲实力,在高性能计算领域占据重要地位。国产高性能AI芯片的主要企业包括华为海思、寒武纪科技、深度求索以及昆仑 chip 等
我国正在高性能芯片领域加大研发力度并展现出显著成效,在图形处理器方面也取得突破性进展;部分解决方案已经成功取代英伟达的技术,在计算能力方面成为一些大型企业的主要选择。
当前国产芯片性能与国际顶尖水平之间仍存在明显差距。
整体上来看,在AI高性能芯片市场方面,
一方面由于进口限制的影响,
另一方面则因内部技术瓶颈导致,
整个市场受限于这些因素。
而在算力领域,
大模型产业的发展在面临一些挑战。
3.2 主流大模型架构仍存在诸多局限
当下已有较多的主流AI大数据模型采用了Transformer架构,在实际应用中发现其主要存在的局限性包括耗能较多和内存占用较大。
首先,在Transformer架构中运行所需的算力资源普遍较高。由于传统Transformer架构具有特定的算法特征,在处理长度逐渐增大的上下文时计算量会呈现显著的二次方增长趋势。如果用户提供的输入上下文规模扩大32倍左右,则可能导致计算量大幅攀升至原来的1000倍以上程度。
随着基于 Transformer架构的大规模模型对存储设备的需求日益增长,在训练过程中,在内存中必须同时保存参数当前值、梯度信息以及其他优化器的状态;当模型参数数量增加时,在计算资源和内存需求上都会随之提升;例如,在拥有100亿个可训练参数的情况下(如大型Transformer架构),所需内存将达到约40GB。
3.3 高质量的训练数据集仍需扩展
国内AI大数据模型的数据主要来源于多个来源渠道,在数据类型完整性方面存在不足,并且在信息可靠性方面也存在问题
从整体情况来看我国可用于大模型训练的中文数据库体系明显偏小例如'悟道'语料库这一重要数据资源不仅包含丰富的文本信息还整合了图文资料以及对话形式其规模最大的仅限于5TB其中纯粹的文本存储空间仅有200GB另一个具有代表性的开源中文本数据库CLUECorps则提供了100GB规模的数据资源与之相比GPT-3所依赖的主要以英语为底色的大规模训练数据总量达到了45TB
此外,在现有大模型技术应用中仍面临一个问题:国内现有大模型在数据来源上仍存在单一化的问题;现有有效数据资源呈现出分布零散的状态;目前而言,在互联网信息获取渠道中只有部分平台具备完整的接口支持;例如,在某些特定搜索引擎(如搜狗)下才可以方便地获取到微信公众号文章内容;而对于多数主流的大模型系统而言,在进行联网数据采集时不具备直接访问微信公众号文章内容的能力
目前,在政策机构及大型企业中
3.4 大模型爆款应用尚未出现
自ChatGPT iOS版本发布已有近十个月的时间以来, 该应用在下载速率或使用频率、用户支出以及会话时长等多个关键指标上, 始终稳居生成式人工智能类应用下载量排行前三位的领先地位
GPT4.0发布后已具备语音输入与输出功能,并能解析用户的自然语言指令并作出相应回应;同时还可以将生成的文字内容以声音的形式呈现给用户。
此外,在2024年1月以来推出并迅速扩展的OpenAI GPT商店中包含了超过300万种功能与服务选项。该平台上的GPT应用被系统性地划分为功能类别包括写作、效率、研究与分析、编程、教育以及生活方式等。
如热门应用 Consensus可支持从海量学术文献中高效检索并输出科学结论;Grimoire系统可以根据用户的输入信息自动生成所需的 HTML、CSS 和 JavaScript 代码,并开发相应的网络解决方案。
就目前情况来看,在国内的大模型产业还未见到有爆款级的应用。其主要原因在于该产业还未找到一条有效的商业化思路,并且缺少能够满足客户个性化需求的应用方案。我国的大模型产业若要推出爆款级的应用,则必须深入挖掘细化应用场景,在各个领域都将会有更多的用户享受到大模型带来的便利。
第四章 天阔云高:中国 AI 大模型产业趋势展望
4.1 AI 云侧与端侧大模型满足不同需求,C 端用户将成为端侧的主要客群
我国云侧大模型种类繁多数量庞大其中百度文心一言阿里通义千问科大讯飞星火腾讯混元等 notable models represent the most advanced ones. 充足的计算能力和海量的数据存储资源为其具备较高的参数规模并且能够实现多种核心功能包括但不限于语言理解知识问答数学推理以及代码生成
一方面,在服务C端个人用户方面,云侧大模型为他们提供对话服务、内容创作、视觉效果呈现以及多媒体内容制作等功能的支持。
另一方面,在面向B端企业用户方面
边缘侧人工智能模型具备低成本运行、便于携带和部署以及防止敏感信息泄露等显著特点,并广泛应用于智能手机、个人电脑以及其它便携电子设备中。
端侧大模型主要服务于 C 端用户群体,在重塑传统个人设备的使用模式与行为习惯的基础上,致力于为用户提供手机文档搜索功能,具备智能化识别屏幕内容的能力,同时支持用户的图像创作需求,并提供生活相关辅助服务以及协助用户的出行安排与管理等专属服务.从成本角度来看,根据云侧大model每次调用的成本及用户的数量与使用频率的不同情况,云侧large model server每年所需投入的成本可能高达数十亿甚至上百亿元人民币,巨额 server 费用成为了阻碍企业大规模部署大model技术的主要因素之一
实现大模型向端侧迁移能够将部分云端计算转移至终端设备,并显著降低了云端服务器的运营成本。从安全性角度来看,在端侧部署大模型可以避免敏感数据通过网络传输至云端存储的风险。多样化的应用场景、较低的成本以及有效的隐私保护措施表明,在未来大模型向端侧迁移的趋势下。
瑞银预测生成式 AI 智能手机销量将从 2023 年的 5,0百万部增至至
背景: 瑞银预测生成式 AI 智能手机销量将从
原始: 瑞银预计生成式 AI 智能手机出货量将从
改写: 瑞银预测生成式 AI 智能手机销量将从
增加了细节描述使表述更加具体
4.2 AI 大模型趋于通用化与专用化,垂直行业将是大模型的主战场
通用大模型具备庞大的参数规模、强大的泛化能力和卓越的多任务学习能力等显著特点。该系统拥有超过数十亿甚至上百亿级的参数量级,在设计架构上进行了全面优化以提升性能与效率。经过海量数据的训练与学习后,在面对新问题时能够有效地提取和识别复杂的模式与特征,并实现对新样本的准确预测。
通用大模型不仅能够掌握理解并习得多种任务涵盖包括文本总结对话问答等
行业大模型适用于金融、政务、医疗等特定行业和领域,更好处理相关行业的特定任务。具体而言,金融大模型能帮助金融企业评估信用风险;政务大模型提供政务问答、公文撰写润色、内容审核;医疗大模型为医生和患者提供影像诊疗、手术评估、导诊服务。
相较于通用大模型而言,行业大模型在专业性突出、数据安全性和稳定性方面具有显著优势。其未来的真正价值则主要体现在其在更多行业和企业中的实际落地应用上。
另一方面,在行业应用中,默认将通用大模型的资源聚焦于构建特定领域的综合能力,并将其所需参数规模较小化处理,则能够有效降低企业在实际落地过程中面临的开发成本。
此外, 行业大模型通过整合企业或机构内部数据资源, 并为企业级用户提供相应的服务支持, 在降低运营成本并提高经营效率方面展现出了显著的优势
4.3 AI 大模型将广泛开源,小型开发者可调用大模型能力提升开发效率
未来阶段内,开源这一趋势的出现将对大模型开发产生重要影响。一方面而言,在这个过程中能够显著降低大模型开发者的使用门槛;另一方面而言,则能够提升算法运行的透明度与可信度
在具体进展中指出,在特定时间点上(即2022年8月),清华大学发布了基于通用模型算法构建的中英双语预训练模型GLM-130B;随后于(即)同年的6月,在国内主要人工智能平台百川智能上架了具备商用规模的大规模预训练语言模型Baichuan-7B,并支持双语能力;紧接着于(即)同年的10月,在智谱AI平台推出了ChatGLM3系列新版本;而在同年的11月,则是vivo公司首次公开了拥有70亿参数量级的大语言模型技术;最后于(即)同年的12月,在阿里云平台上提供了多款大语言新星Qwen-72B、Qwen-1.8B以及结合语音识别功能的Qwen-Audio等多款大语言技术
正是助力AI大模型产业实现持续性创新发展的关键措施。
小型开发者能够利用大模型技术提升编程效率,并在此基础上推动更多AI相关技术的实际应用。
一方面,小型开发者能够基于大模型进行项目开发.应用程序开发以及插件开发;另一方面,他们无需依赖于算力资源,并且不需要复杂的模型训练和参数调试即可轻松完成应用部署.
此外, 小型开发者借助大模型技术来提升开发效率, 将大模型能力整合到代码工具中以帮助完成大量重复性任务, 根据开发者的需求提供个性化的代码优化建议, 并且能够自动生成相关的测试案例来缩短工程师的开发和调试时间.
4.4 AI 高性能芯片不断升级,AI 大模型产业生态体系将不断完善
在大模型应用中,在处理大量数据时,在线学习系统需要依赖先进计算平台进行高效的参数更新与优化过程。
在全球 AI 高性能芯片市场的竞争格局中
近年来,在国内市场的推动下,AI 高性能芯片发展速度显著提升。其中以华为昇腾系列中的310型和910型芯片为主打产品。采用7纳米制程工艺的则是昇腾910型号,在计算能力方面表现格外突出:其计算能力达到256 TeraFLOPS级,并支持FP16格式运算;在能效方面表现优异:寒武纪科技则是一家在中国市场占据重要地位的本土AI芯片制造商。
在未来的阶段中, 随着全球范围内AI高性能芯片的持续更新换代与技术突破, 在推动大模型性能与能力方面也将展现持续进步的趋势
AI 大模型将加快新质生产力发展,助力我国经济社会高质量发展
AI 大模型能够展现新的商业价值,并满足新兴行业的技术需求,有助于推动产业升级;对于加快实现高质量发展至关重要。
AI 大模型在当前人工智能领域扮演着重要角色,在新兴高效生产力的产生中提供了肥沃土壤。由创新主导形成的新兴高效生产力成功摆脱了传统经济增长模式和 conventional productivity development paths,并具备高科技属性、高效率水平以及高质量产出。这种契合新时代发展理念的前沿性先进生产力形态,则是由技术创新突破、生产要素的优化重组以及产业体系的深度升级转型所催生
以劳动者与劳动资料的有机融合、劳动对象及其优化整合为基本内涵,在全要素生产率持续攀升中确立核心地位。基于人工智能的大模型体系作为促进生产力质的飞跃的关键技术手段,则能够带动多个行业向智能化转型,在这一过程中显著提升了生产效率,并有效降低了运营成本的同时实现了产业竞争优势的持续增强。
随着中国经济逐步迈向高质量发展阶段,在推动新产业、新模式、新动能成长方面,AI 大模型展现了显著的潜力,并为其高质量发展提供了有力支撑;这一成就与《国家创新驱动发展战略纲要》所提倡的创新驱动战略和产业升级方向高度契合
我国众多产业对高质发展的需求将成为大模型落地应用的基础。随着人工智能技术的发展不断升级,大模型产业化应用已具备可行性条件。科技创新企业推出的大型模型为生产生活的方方面面带来更多便利,推动商业模式创新,引领产业升级,让人们的日常生活更加便捷美好。
未来 period,我国需进一步优化协调基础研究和创新资源的配置方向,在推动大模型技术各领域的发展需求下,助力实现技术应用体系的战略性突破。同时要充分考虑经济结构转型升级带来的新要求,在促进经济高质量发展的过程中持续提升关键领域竞争力。
**
