Advertisement

全球&中国 AI 大模型 ( LLM ) 列表

阅读量:

文章目录

  • AI 大模型简介

  • 中国大模型列表

    • 大模型列表
    • 国外大模型
  • 开源大模型

    • 基础大模型
    • 非基础大模型
    • 模型架构

AI 大模型简介

大型语言模型(缩略为LLM)作为一种先进的人工智能技术,在经过深度学习算法训练后能够自主生成多样化的自然语言文本内容。这些智能文本可以包含文章报道对话交流等多种形式。该技术因其广泛的应用场景现已被公认为人工智能领域的前沿科技之一并受到了社会各界的关注

AI 大模型的核心是基于先进的人工智能技术体系。传统的人工智能架构通常依赖于层次化的感知器设计模式,在其中每个感知器单元都与上一层的所有单元相连并赋予其独立的权重参数与偏置量值。利用这一机制设计出的信息传递路径实现了对复杂数据模式的有效学习与自我优化调节能力。而现代人工智能系统则采用了更为复杂的架构设计——循环人工神经系统(Recurrent Artificial Neural System),这一独特架构能够有效处理序列数据建模任务并将历史信息融入当前处理流程之中从而显著提升了大系统在理解和处理自然语言方面的性能

AI 大模型明显依赖于大规模的训练数据和计算资源。例如,在当前最知名的大规模语言模型中——如GPT-3——采用了超过100亿个单词的数据集进行微调,并通过密集型矩阵运算等技术实现了高效的参数更新。此外,在优化过程中需要采取多种措施以防止过拟合问题的发生,并通过严格的语法校对和逻辑分析机制确保生成内容的质量。

在自然语言处理领域中,AI 大模型的应用极为广泛。不仅包括机器翻译、文本生成和问答系统等基础功能,还涵盖了智能客服、语音识别等多个新兴领域。其中最引人注目的应用领域是对话系统的开发,旨在实现计算机与人类之间的自然语言交互。相较于传统基于规则的对话系统,AI 大模型能够更精准地理解和处理用户输入,并提供更加连贯和自然的回应。同时,在文本创作方面,AI 大模型其在文学创作和新闻报道等领域展现出显著的能力。

尽管AI 大模型在多个领域展现出广阔的潜力,并非没有面临诸多挑战与争议。例如,在训练过程中,大模型需要消耗大量计算资源和能源,并对环境产生深远的影响。同时,在生成文本的过程中,可能出现某些不适合或有害的内容;这种现象在网络平台如社交媒体上尤为突出。因此,在实际应用中仍需进一步探索与规范

总体来看,可以说AI 大模型是一种备受期待的人工智能技术,在自然语言处理等领域的应用潜力依然巨大。随着人们对大模型的认识和研究逐步深入,未来我们预计将会看到更多创新与进展,并且这些技术能够更好地服务于人类社会的发展需求。

中国大模型列表

大模型列表

序号 公司 大模型 省市 官网 说明
1 百度 文心一言 北京 试用需账号,有APP
2 科大讯飞 星火 安徽合肥 试用需账号,有APP
3 达观数据 曹植 上海 试用需账号
4 阿里云 通义千问 浙江杭州 试用需账号
5 复旦大学 MOSS 上海 试用需账号
6 清华大学 ChatGLM,NowcastNet 北京 开源6BChatGLM2-6B, 智谱AI,气象,临近预报大模型
7 华为 盘古,盘古气象,盘古-Σ 广东深圳 华为+鹏城,华为云盘古
8 智源人工智能研究院 悟道·天鹰,悟道·EMU 北京 悟道3.0,视界视觉,AQUILA天鹰座,Aquila-7B,AquilaChat-7B,AquilaCode-7B-NV,AquilaCode-7B-TS,HuggingFace,EMU基于LLaMA
9 浙江大学 启真,PromptProtein 浙江杭州 医学大模型提供基于LLaMA-7B、CaMA-13B和ChatGLM-6B 三个版本,用于PromptProtein的模型
10 百川智能 baichuan-7B,Baichuan-13B 北京 模型下载:Baichuan-13B-Base,Baichuan-13B-Chat,Baichuan-7B,开源可商用
11 上海人工智能实验室 书生·浦语, OpenMEDLab浦医 上海 技术报告,开源的InternLM-7B,HuggingFace下载模型权重
12 贝壳 BELLE 北京 基于BLOOMZ或LLaMA的多个模型
13 哈尔滨工业大学 本草 黑龙江哈尔滨 医学;基于LLaMA;另有基于 ChatGLM 的Med-ChatGLM
14 云知声 山海 北京
15 OpenBMB CPM,CPM-Bee 北京 面壁智能,CPM-Bee-10B
16 港中文深圳 华佗凤凰 广东深圳 香港中文大学(深圳)和深圳市大数据研究院,医学,Demo,华佗和凤凰都基于BLOOMZ
17 中国科学院自动化研究所 紫东·太初 北京 紫东太初2.0号称100B参数,全模态
18 虎博科技 TigerBot 上海 基于BLOOM
19 东北大学 TechGPT,PICA 辽宁沈阳 TechGPT->BELLE->LLaMA,图谱构建和阅读理解问答;PICA->ChatGLM2-6B情感大模型
20 上海交通大学 K2,白玉兰 上海 Demo,GeoLLaMA,基于LLaMAHuggingFace
21 IDEA研究院 封神榜MindBot 广东深圳 姜子牙系列模型
22 度小满 轩辕 北京 基于BLOOM
23 360 智脑,一见 北京
24 艾写科技 Anima 浙江杭州 基于Guanaco->基于LLaMA,使用QLoRA
25 北京大学信息工程学院 ChatLaw 北京 ChatLaw-13B基于Ziya-LLaMA-13B-v1->LLaMA,ChatLaw-33B基于Anima33B->Guanaco->LLaMA
26 华南理工大学 扁鹊,灵心SoulChat 广东广州
27 中国科学院计算技术研究所 百聆 北京 基于 LLaMA,权重Diff下载7B13B,demo
28 西湖心辰 西湖 浙江杭州
29 晓多科技+国家超算成都中心 晓模型XPT 四川成都
30 稀宇科技 MiniMax 上海 GLOW虚拟社交
31 北京语言大学 桃李 北京 基于LLaMA,北语+清华+东北、北京交大
32 商汤科技 日日新 上海
33 国家超级计算天津中心 天河天元 天津
34 星环科技 无涯、求索 上海 无涯——金融;求索——大数据分析
35 慧言科技+天津大学 海河·谛听 天津
36 恒生电子 LightGPT 浙江杭州
37 电信智科 星河 北京 通用视觉,中国电信
38 左手医生 左医GPT 北京 医疗,试用需Key
39 智慧眼 砭石 湖南长沙 医疗领域
40 好未来 MathGPT 北京 学而思
41 数慧时空 长城 北京 自然资源,遥感
42 理想科技 大道Dao 北京 运维大模型
43 硅基智能 炎帝 江苏南京
44 中工互联 智工 北京 与复旦NLP实验室联合,工业领域
45 创业黑马 天启 北京 创业黑马与360合作,科创服务行业
46 追一科技 博文Bowen 广东深圳
47 上海科技大学 DoctorGLM 上海 医学大模型,论文
48 华东师范大学 EmoGPT,EduChat 上海 EmoGPT是上海市心理健康与危机干预重点实验室与镜象科技公司合作完成, 教学教育大模型EduChat基于BELLE(BELLE基于LLaMA)
49 昆仑万维 天工 北京 与奇点智源联合研发
50 智媒开源研究院 智媒 广东深圳 基于LLaMA,面向自媒体
51 医疗算网 Uni-talk 上海 上海联通+华山医院+上海超算中心+华为
52 蚂蚁集团 贞仪 浙江杭州 据传语言和多模态两个
53 香港科技大学 罗宾Robin 香港 基于LLaMA,港科大开源LMFlow
54 腾讯 混元 广东深圳
55 拓尔思 拓天 北京
56 乐言科技 乐言 上海 TRSGPT
57 清博智能 先问 北京 基于结构化数据
58 智子引擎 元乘象 江苏南京
59 拓世科技 拓世 江西南昌
60 循环智能 盘古 北京 循环智能,清华大学,华为
61 印象笔记 大象GPT 北京
62 第四范式 式说 北京
63 字节跳动 Grace 北京 内部代号
64 出门问问 序列猴子 北京
65 数说故事 SocialGPT 广东广州
66 云从科技 从容 广东广州
67 浪潮信息 山东济南
68 中国农业银行 小数ChatABC 北京
69 麒麟合盛 天燕AiLMe 北京
70 台智云 福尔摩斯FFM 台湾 华硕子公司
71 医联科技 medGPT 四川成都
72 理想汽车 MindGPT 北京
73 深思考人工智能 Dongni 北京
74 长虹 长虹超脑 四川绵阳
75 孩子王 KidsGPT 江苏南京
76 中科闻歌 雅意 北京
77 澜舟科技 孟子 北京
78 京东 言犀 北京
79 智臻智能 华藏 上海 小i机器人
80 新华三H3C 百业灵犀 浙江杭州
81 鹏城实验室 鹏城·脑海 广东深圳 Peng Cheng Mind
82 宇视科技 梧桐 浙江杭州 AIoT行业
83 网易有道 子曰 北京
84 美亚柏科 天擎 福建厦门 公共安全
85 赛灵力科技 达尔文 广东广州 赛灵力,清华珠三角研究院,赛业生物,大湾区科技创新服务中心
86 实在智能 塔斯 浙江杭州 TARS
87 佳都科技 佳都知行 广东广州 交通领域
88 知乎 知海图 北京 知乎和面壁科技合作
89 网易伏羲 玉言 广东广州
90 清睿智能 ArynGPT 江苏苏州
91 微盟 WAI 上海
92 西北工业大学+华为 秦岭·翱翔 陕西西安 流体力学大模型,湍流+流场
93 奇点智源 Singularity OpenAPI 北京 瑶光和天枢
94 联汇科技 欧姆 浙江杭州 OmModel欧姆多模态(视觉语言)大模型
95 中国联通 鸿湖 北京
96 思必驰 DFM-2 江苏苏州
97 中科创达 魔方Rubik 北京
98 电科太极 小可 北京 党政企行业应用
99 中国移动 九天 北京
100 中国电信 TeleChat 北京
101 容联云 赤兔 北京 客服,营销
102 云天励飞 天书 广东深圳
103 维智科技 CityGPT 上海 城市大模型
104 沪渝人工智能研究院 兆言 重庆 也称:上海交通大学重庆人工智能研究院
105 企查查 知彼阿尔法 江苏苏州
106 超对称技术公司 乾元 北京
107 蜜度 文修 上海 智能校对
108 中国电子云 星智 湖北武汉 政务大模型

国外大模型

公司 大模型 说明
OpenAI ChatGPT
微软 Bing Chat
Google PaLM2,Bard,Gemini Bard支持图片
Anthropic Claude Claude 2,支持读入pdf、txt、csv等文件进行分析、总结和问答等
Meta LLaMA
Stability AI StableLM
Amazon Titan
Bloomberg BloombergGPT
MosaicML MPT
Intel Aurora genAI
UC Berkeley, Microsoft Research Gorilla
inflection.ai Inflection-1
xAI 从OpenAI 到xAI
cohere Cohere
Scale AI Scale
character ai Character

开源大模型

基础大模型

序号 名称 参数规模 数据规模 说明
1 LLaMA 7B,13B,30B,65B 1.4T Meta,代码开源,模型“泄露”,不可商用,详细介绍
2 OPT 6.7B,13B,30B,66B,175B
3 BLOOM 3B,7.1B,176B 366B 可商用,最为宽松,详细介绍
4 GALACTICA 6.7B,30B,120B
5 Falcon 7B,40B
6 MOSS 16B
7 ChatGLM 6B
8 StableLM 3B,7B 800B
9 baichuan 7B,13B 1.2T 开放,商用需授权
10 Aquila 7B,33B 悟道·天鹰
11 RedPajama 3B,7B
12 GPT-NeoX 20B 800GB的The Pile数据集
13 OpenLLaMA 3B,7B,13B 1T
14 MPT 7B,30B 1T
15 Pythia 2.8B,6.9B,12B 300B
16 XGen 7B 1.5T

非基础大模型

  • WizardLM
  • Alpaca
  • Vicuna
  • Guanaco

模型架构

全部评论 (0)

还没有任何评论哟~