Advertisement

AI大模型的10大趋势预判!

阅读量:

AI大模型的10大趋势预判!

原创 花哥 AI大模型前沿 2024-04-03 21:34 福建

AI大模型前沿

关注我,关注Ai大模型的全部信息!

8篇原创内容

公众号

大模型领域的竞争态势日益白热化。近年来备受关注的文生视频平台Sora先后与谷歌推出了Gemini 1.5版本,在Meta公司的推动下推出了V-JEPA系统,并且还有Claude 3系统已超越GPT-4水平。OpenAI计划于近期推出下一代生成式人工智能平台GPT-5。作为科幻领域的经典角色之一,在现实科技发展中,奥特曼不仅自主研发了硬件平台(芯片等),还在布局可控制核聚变技术,并为其未来发展提供技术与能源保障。

在计算资源紧张与数据资源短缺的平衡下,在快速变革中个人预测未来大模型发展中的关键点有十个

判断一:中国基础大模型的数量会快速收敛,卷不动了

中国大模型行业呈现出'百模争锋'的趋势,但到2024年为止,随着基础大模型如Claude3以及视频类大模型如Sora的能力得到显著提升,行业将面临资源短缺以及'套壳'的大模型厂商可能退出的竞争格局,最终将由少数几家企业及少量明星创业企业展开竞争。与此同时,国外市场主要以大型企业与初创公司合作为主,例如微软与Open AI、谷歌与Deepmind等知名机构均采取此策略。芯片巨头英伟达在2023年大幅加大投入生成式AI相关项目,较2022年的投资额增长了6倍之多。然而值得注意的是,国外基础大模型领域并未出现像中国这样激烈的竞争态势

判断二:万卡是一个入门的算力

近日

展开竞争

在2023年上半年度中国前三季度里,英伟达中国的营收数据经估算显示,在建新产能规模相当于58万张A100类显卡,在全球范围内仍远逊于Meta公司的表现。这种落后态势主要是由于受到美国针对高端芯片实施的技术封锁政策影响,在全球范围内寻求先进计算能力支持方面陷入了被动境地。在此背景下,中国的芯片企业如华为技术有限公司与海光信息科技有限公司等均面临产能瓶颈制约,在满足大模型训练需求方面仍存在明显缺口。此外,在国产人工智能专用芯片领域还存在适应性周期长、生产成本高昂以及研发难度极大的关键问题制约因素存在的情况下,则进一步拖延了国产大模型训练的整体进程

判断三:大模型的能力主要由金字塔尖的顶尖人才的认知构成,在小团队中同样能够培养出高度智能的团队

大模型的发展主要由顶尖人才主导推动,在人才密度与强度方面具有显著优势。在人工智能领域具有里程碑地位的三位关键人物——Sam Altman、Greg Brockman以及首席科学家伊利亚,在7年间投入了数亿美元资金,并坚定地信仰着人工智能通用智能(AGI)的目标,成功开发出了ChatGPT这一划时代的智能聊天系统。同样备受关注的是Claude模型公司的成立,该公司的核心成员不仅在技术上有着深厚的积累,在大模型研发方面也取得了突破性进展。尽管规模相对较小,在技术实力方面同样值得关注的是Character.ai平台——它是由OpenAI的核心成员创建,并凭借具有Google前员工Noam Shazeer技术支持的技术背景,在全球聊天应用领域排名第二。而Mistral公司则由来自前DeepMind及Meta的科学家组成团队,并在开发过程中积累了丰富的经验,在基准测试中表现优异

判断四:开源大模型难以胜过闭源

开源被视为软件发展的重要方向之一,并促进了应用生态的成长。随后,在生成模型的发展中出现了一个转折点——从GPT3起, Open AI选择采用闭源策略,这一决定使得大多数大模型仅达到GPT-3.5水平的表现,并受限于这一技术瓶颈

从生态系统建设的角度来看,在资源利用效率和技术创新方面具有明显优势的开源方式更适合进行生态系统的构建与维护。然而,在实际应用中受到计算能力与算法性能等因素制约的前提下,基于现有技术积累的开源方案难以实现基础大模型自身快速迭代的需求。

判断五:能走多远,取决于对AGI和Scaling Law的信仰

越来越多的大模型企业对AGI实现抱有更深的信念。Sora探索的道路从视频理解延伸至世界模拟器构建;同时杨乐昆提出了自己的世界模型构想。其成功实践进一步印证了视频领域Scaling Law的应用价值及其重要性;引导企业在面对疑惑时采取扩大规模的策略。

判断六:个人应用要过千万月活门槛

在移动互联网时代背景下,在中国市场上,AI原生类APP的发展相对滞后,即便是在当前互联网生态中,仍有较大比例的用户尚未接触过此类应用,尤其是在二三线及以下城市地区.基于QuestMobile的最新调研数据显示,头部类AI应用去重后的月活跃用户规模已突破5000万大关,其中以豆包、文心一言等应用均占据月活跃用户千万级市场份额,其次还包括天工、扮伴-AI绘画及讯飞星火等应用.

值得注意的是,在过去一年中全球排名前50的人工智能工具均获得了包括超过240亿次的访问量。其中 ChatGPT 在这段时间里以140亿次的访问量遥遥领先,并占据了分析流量的近六成。

判断七:手机端侧大模型将加剧和超级APP的入口之争

大模型正在逐步转移至端侧架构,在这一趋势下,AI推理技术得以在包括手机、PC、耳机等在内的各种新型终端上实现应用。这种架构下的端侧大模型展现出显著优势特点:不仅具备本地数据处理高效的特点,还能够降低云端运算成本的同时加强了用户数据的隐私保护能力,并开创了全新的交互模式。展望未来,在结合量化处理后的个人数据后段架构将更有可能成为提升手机操作流畅度的关键技术支撑点,并可帮助设备执行更多与设备原生交互的功能。目前已有多家企业推出了相应的端侧大模型产品线如小米推出了其自研的MiLM系列和VIVO推出了旗下蓝心产品线等;同时芯片厂商也纷纷响应这一技术方向积极提供相关技术支持如高通和苹果等均已在相关领域展开深入的技术布局以支持端侧推理模式的发展。

判断八:效率、体验、创造是当前大模型落地三大核心价值

效能是大模型促进自动化的关键环节。使用体验与创新则是其落地的主要推动力。交互界面更加友好直观,并让机器能够更好地理解和响应指令、语言以及人们的情感需求。

生成式大模型的核心能力是创造,在文字、图片、传媒影视等多个领域得到了广泛应用。此外,在广告、短视频以及游戏等多个领域也可见其身影。值得注意的是,在AI4S领域中,创造不仅赋予了人们更大的想象空间,在未来还可能带来更多的突破。例如,在过去的一周内,开发出的深度学习工具仅需17天即可合成41个拟命名化合物(Compound),其中的成功率达到71%,平均每天能产出两个以上的新化合物。

判断九:未来可能出现更多的一人企业

大模型与AI Agent的发展赋予了个人更多智能工具的支持。在将来阶段中, 个人可能会拥有的助理数量增加, 这就提高了对个人领导力和判断力的需求。这一趋势正在重塑传统大企业的组织方式, 导致组织内部个体角色更加多样化, 如身兼多职。同时, 数字员工作为企业核心竞争力的重要组成部分之一, 其数量与质量同样不可或缺。

判断十:“技术派”VS“变现派”的争论在3年内会有定论

最近,《小珺访谈录》对此两位学者的观点进行了对比分析。研究表明,中国科技界对大模型技术的态度呈现明显的分歧。一方是技术信仰型追随者,他们倡导效仿OpenAI的研究方向——追求通用人工智能(AGI)及标淮化进步规律。认为通过提升模型能力并减少投入成本可带来更广泛的应用潜力。另一方则是市场导向型的支持者,并利用中国市场的独特优势数据构建竞争优势。这种分歧实际上反映了长期主义与实用主义两种理念之间的对立。

OpenAI的支持使长期主义者倍感振奋,并预见到在2026年前可能出现诸如GPT-7这样的更强大模型并具备商业潜力。然而,在减少幻觉的可能性仍然是一个技术难题;未来大型语言模型可能会通过提供置信度概率来帮助区分这些判断

总结而言,在标度定律(scaling law)的基础上分析可知**

全部评论 (0)

还没有任何评论哟~