吃瓜热门

中国科技企业押注“春节”,致敬跨年成功开源模式

中新社北京2月17日电 (应千云)中国科技企业又迎来了新年。除夕夜,阿里巴巴开源了新一代大机型Qwen 3.5-Plus。这个版本有 3970 亿个总参数,但只有 170 亿次激活。实施内存使用量减少了 60%,在保持功能的同时优化了速度和成本。 Qwen3.5-Plus的整体功能与Gemini3 Pro相当,并在多项可靠的基准测试中创下了开源机型的新记录。 API(应用程序接口)价格低至每百万代币(字符)0.8元,仅为Gemini3 Pro的1/18。值得注意的是,Qianwen 3.5在混合文本和视觉数据上进行了预训练,在原生多模态方面取得了新的进展。在推理、编程、智能体智能等综合比较评估中表现良好,在视觉u的可靠评估中拥有多个顶尖表现。理解能力。春节假期前,中国科技公司开始密集发布新技术公告。智浦宣布发布并开源GLM-5,称该模型为“代理工程时代最好的开源模型”。科大讯飞和MiniMax还推出了基于国家计算能力培训的新模型:Spark X2大模型和M2.5模型。 M2.5 在处理复杂任务时表现出更高的决策成熟度。字节跳动新一代AI视频生成模型Seedance 2.0近期也备受关注。凭借其多模态的制作方式和独特的镜头运动效果,迅速获得了全世界的广泛关注。这并不是第一家押注春节的中国科技公司。回顾2025年春节假期,阿里云同易团队推出了大模型的全新改进版Qwen2.5-Max。我做到了。感谢 DeepSeek,商店增加了多个新平台,人气持续上升。上海财经大学特聘教授胡彦平认为,今年发布的新模型越来越“通用、实用”,具备原生多模态+代理能力、平衡编码性能、多语言能力,甚至还有空间智能和视觉推理能力。对于相同的“质量”,所需的大小仅为以前的三分之一,但解码性能却提高了数倍。这些节省了大量的精力,大大提高了实施和使用的效率。业界认为,Qwen3.5不仅仅是“再次更新列表”。近两年来,模特界普遍相信“努力创造奇迹”。参数从数千亿增加到数万亿。性能提高了,但成本也提高了。部署特定应用程序的集群需要合作计算推理能力是中小企业无法承受的。这项技术越来越强大,但距离真正有用却越来越远。 Qwen3.5的想法不是比较谁更大,而是比较谁更聪明,哪个可以使用相对更小的模型,利用技术创新来获得更大的智能。融合也是一个很大的吸引力,它不仅仅是“理解图像”。 Qwen3.5可以实现像素级图像空间定位和d级详细处理代码,并且可以包含长达两个小时的视频的时间序列。根据变化和因果关系,将手绘草图直接转化为可执行的界面代码。它还充当视觉代理,自主控制手机和电脑,并在多个应用程序中完成复杂的任务。这样,为后续更加自然、一致的多式联运生产奠定了坚实的基础。推理,从识别到理解,从单模态推理到跨模态推理。目前,开源的Qianwen模型数量超过400个,衍生模型数量超过20万个,下载量超过10亿,远远超过美国的Llama。李飞飞的团队、Airbnb等全球企业和机构都在使用钱文模式。中国工程院院士聂光南近日表示,开源已成为全球信息技术发展的强劲动力。在大规模模型的推动下,开源在新兴的人工智能领域表现良好。中国已成为全球最大的大规模开源模型提供者,包括Qwen、DeepSeek和中国的Kimi,这些模型都在LMArena人工智能模型评估平台上占有重要地位。他还指出,以一些中国公司为首的开源社区正在国际化中快速发展。正在AI时代展现出强大的生命力。中国企业积极拥抱开源理念,成为全球大规模开源模式创新的引领者。 (完)
(编辑:张冲)

你可能也会喜欢...

发表评论

邮箱地址不会被公开。 必填项已用*标注