Advertisement

2024年10~11月大模型更新汇总

阅读量:

1. 通义千问增加Coder模型

通义千问推出了‘qwen-coder-plus’专用代码模型, 专为代码生成、修复和推理场景设计。该模型具备长达128千字符的上下文能力, 能够生成最多8千字符的响应, 输入费用定为每百万tokens 3.5元, 输出费用则高达7元/百万tokens。虽然单价稍高于某些同类产品, 但其性能指标明显优于DeepSeek、GPT-4o以及Claude 3.5 Sonnet系列, 这一优势使得它成为专业开发者在技术方案选择上优先考虑的对象

  1. QwQ-32B-Preview

在11月底,通义千问团队发布了名为QwQ的模型。该模型主要侧重于提升增强型AI的推理能力,并且其定位似乎是基于o1-preview这一基准版本进行开发。目前该模型可免费使用,并支持处理不超过32千字节的内容;同时能够生成不超过16千字节的回答内容。

3. 文心一言更新超值与旗舰模型

智匠MindCraft引入了文心一言系列的三款新模型:

  • ernie-speed-128K :高速版本的免费模型,默认配置下专为处理基础且无需复杂上下文的任务设计;最大支持的上下文长度为128千字。
  • ernie3.5-128K :高端组合版模型,在预算有限但又需要平衡性能与成本的应用场景中使用;每一百万个token的输入成本仅需0.8元;输出成本则提升至每一百万个token 2 元;特别适合在中小规模应用中展现出良好的性价比优势。
  • ernie4.0-turbo-128K :顶级性能版本的产品线成员,在面对对计算资源和性能要求极高的专业环境时能够提供卓越的支持;每一百万个token的输入费用达到每一百万 token 二十 元;输出费用则高达每一百万 token 60 元;特别适用于对计算资源和性能要求极高的专业环境。
4. MiniMax新增abab7.0旗舰模型及图片识别功能

MiniMax推出了新款旗舰型 abab7-chat-preview ,具备245千上下文能力,并升级了图像识别功能。此外 abab6.5s 主打型号同样提升了图像识别能力。它成为国内最便宜的图像识别模型(每百万token 1元),适用于处理简单的图像。

5. 腾讯发布MOE模型hunyuan-large

腾讯公司推出了最新旗舰级AI模型 Hunyuan-Large ,其具备以下特点:拥有参数规模达389亿个、最长可处理序列长度为128K tokens;输入端价格定为每百万tokens 4元人民币(RMB),输出端定价则为每百万tokens 12元人民币。评测机构的数据表明,在多个关键指标上该模型均超越了开源基准模型Llama 3.1至4.0B版本,并在数学能力测试中取得了显著优势。

6. 百川智能更新baichuan4-turbo及baichuan4-air

百川智能推出了两款新模型:

  • baichuan4-turbo :专注于企业高频场景的优化工作,在首令牌响应速度和Token流速方面得到了显著提升。该模型可处理的最大支持的上下文长度为32千个Token(即32K),其每百万Tokens的输入输出成本达15元人民币,在性价比方面表现突出。
  • baichuan4-air :此款产品作为性价比较高的MoE模型,在输入输出成本方面表现突出——每百万Tokens的成本仅为0.98元人民币——特别适合低成本部署方案的应用环境。然而其支持的最大上下文长度仅为32千个Token(即32K),稍显不足之处在于这一限制可能影响某些特定应用场景的表现。
7. 零一万物发布yi-lightning

零一万物推出了具有经济效率的yi-lightning模型。该模型采用先进的算法架构,在计算资源利用方面表现突出。实验数据显示,在不同数据集上均获得95%以上的准确率。经过在LMSYS等国际权威评测中的全面评估与测试,在各项关键指标上均表现优异。

智MindCraft AI官网

全部评论 (0)

还没有任何评论哟~