(相关资料图)
人民财讯9月12日电,9月12日,阿里发布了下一代基础模型架构Qwen3-Next,并开源了基于该架构的Qwen3-Next-80B-A3B系列模型。相比于Qwen3的MoE结构,Qwen3-Next架构进行了一系列核心改进,具有更高效的特点。Qwen3-Next-80B-A3B-Base模型拥有800亿参数,激活参数仅30亿,实现了与Qwen3-32B dense模型相近甚至略好的性能,而训练成本仅为十分之一不到,实现了极致的训练和推理性价比。
下一篇: 最后一页
所有文章、评论、信息、数据仅供参考,使用前请核实,风险自负。
Copyright 2013-2020 高陵经济网 版权所有 京ICP备2022016840号-34
联系邮箱:920 891 263@qq.com glxcb.cn All Rights Reserved