首页 -> 资讯 > 要闻 > 正文

刚刚,DeepSeek开源V3.2-Exp,公开新稀疏注意力机制DSA

    来源: 市场资讯  2025-09-29 18:56:20

来源:机器之心

还是熟悉的节奏!


【资料图】

在假期前一天,DeepSeek 果然搞事了。

刚刚,DeepSeek-V3.2-Exp 开源了!

该模型参数量为 685B,HuggingFace 链接:

https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Exp

此外,此次发布竟然也同步公开了论文,公开了 DeepSeek 新的稀疏注意力机制,为我们提供了更多结束细节:

https://github.com/deepseek-ai/DeepSeek-V3.2-Exp/blob/main/DeepSeek_V3_2.pdf

在官方介绍中,DeepSeek 表示 DeepSeek-V3.2-Exp 是实验版本。作为迈向下一代架构的过渡,V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek 稀疏注意力机制(DeepSeek Sparse Attention,DSA)—— 一种旨在探索和验证在长上下文场景下训练和推理效率优化的稀疏注意力机制。

DSA 也是 3.2 版本的唯一架构改进。

DeepSeek-V3.2-Exp 的架构,其中 DSA 在 MLA 下实例化。

重点要说的是,DeepSeek 称该实验版本代表了他们对更高效的 Transformer 架构的持续研究,特别注重提高处理扩展文本序列时的计算效率。

在 v3.2 版本中,DeepSeek 稀疏注意力 (DSA) 首次实现了细粒度稀疏注意力,在保持几乎相同的模型输出质量的同时,显著提高了长上下文训练和推理效率。

为了严格评估引入稀疏注意力机制的影响,DeepSeek 特意将 DeepSeek-V3.2-Exp 的训练配置与 9 月 22 日刚刚推出的 V3.1-Terminus 进行了对比。在各个领域的公开基准测试中,DeepSeek-V3.2-Exp 的表现与 V3.1-Terminus 相当。

更多信息,读者们可以查阅 DeepSeek-V3.2-Exp 的 huggingface 介绍。

值得一提的是,智谱的 GLM-4.6 也即将发布,在 Z.ai 官网可以看到,GLM-4.5 标识为上一代旗舰模型。

最后,有一波小节奏。在模型发布前,已经有网友在 Community 里发帖称:国庆是休息日,请给我们关注的同学一点休息时间。

对此,你怎么看?

标签:

【免责声明】

1、凡本网注明出处非(巨潮财经网)的作品,均转载于自其它媒体,并不代表本网赞同其观点和对其真实性负责,目的在于信息的传递,本网不承担稿件侵权行为的连带责任,如对稿件有质疑请与本网客服联系。

2、刊发此文目的在于传递更多信息,文章内容仅供参考,不构成投资建议,投资者据此操作,风险自担。

3、如涉及作品内容、版权等其它问题,请在15日内联系本网客服。

阅读延展

刚刚,DeepSeek开源V3.2-Exp,公开新稀疏注意力机制DSA

刚刚,DeepSeek开源V3.2-Exp,公开新稀疏注意力机制DSA

刚刚,DeepSeek开源V3 2-Exp,公开新稀疏注意力机制DSA

2025-09-29 18:56:20

微资讯!九毛九:2025年中期净利润6069.1万元 同比下降16.05%

微资讯!九毛九:2025年中期净利润6069.1万元 同比下降16.05%

中证智能财讯九毛九(09922)9月29日披露2025年中期报告。报告期内,公

2025-09-29 18:06:25

每日观点:银行的投资策略是否适合长期投资者?

每日观点:银行的投资策略是否适合长期投资者?

对于长期投资者而言,选择合适的投资策略至关重要,而银行提供的投资策

2025-09-29 10:06:06

国家能源局公告2025年第4号

国家能源局公告2025年第4号

国家能源局公告2025年第4号,2025年9月19日,国家能源局发布国家能源局

2025-09-29 09:25:24

你见过“脚上排球”吗?它在南宁开赛了!

你见过“脚上排球”吗?它在南宁开赛了!

9月27日,来自中国与东盟国家的10支队伍在南宁三塘体育训练比赛基地集

2025-09-28 22:22:45

最近更新

刚刚,DeepSeek开源V3.2-Exp,公开新稀疏注意力机制DSA

刚刚,DeepSeek开源V3.2-Exp,公开新稀疏注意力机制DSA

刚刚,DeepSeek开源V3 2-Exp,公开新稀疏注意力机制DSA

2025-09-29 18:56:20

洪峰来了,全面停航、4处公路坍塌中断、480人上堤_时讯

洪峰来了,全面停航、4处公路坍塌中断、480人上堤_时讯

湖北日报讯(记者张乐克)雨线压着江面,堤上警戒灯上一盏盏亮起——汉

2025-09-29 18:13:19

童声里的中国

童声里的中国

9月28日,“童声嘹亮、唱响荆楚”2025年湖北省“童声里的中国”少年儿

2025-09-29 18:11:54

生意社:9月29日山东地区醋酸行情观望运行_播资讯

生意社:9月29日山东地区醋酸行情观望运行_播资讯

9月29日,山东地区醋酸市场价在2490元 吨左右,国内醋酸市场观望为主,

2025-09-29 18:06:06

微资讯!九毛九:2025年中期净利润6069.1万元 同比下降16.05%

微资讯!九毛九:2025年中期净利润6069.1万元 同比下降16.05%

中证智能财讯九毛九(09922)9月29日披露2025年中期报告。报告期内,公

2025-09-29 18:06:25

国家金融监督管理总局台州监管分局核准何翼兴业银行台州分行行长助理-实时

国家金融监督管理总局台州监管分局核准何翼兴业银行台州分行行长助理-实时

2025年09月29日,国家金融监督管理总局台州监管分局核准何翼兴业银行台

2025-09-29 17:10:19

学法时习之|10月起,这些新规将影响你我生活-焦点讯息

学法时习之|10月起,这些新规将影响你我生活-焦点讯息

完善治理“内卷式”竞争制度;明确永久基本农田划定后任何单位和个人不

2025-09-29 16:26:10

10月新规来了,一起来看!_当前看点

10月新规来了,一起来看!_当前看点

新办法守住永久基本农田保护红线;铁路、民航10月1日起全面使用电子发

2025-09-29 16:14:32

保险产品的保障内容是否应该定期评估?

保险产品的保障内容是否应该定期评估?

在保险规划中,很多人在购买保险产品后就将其搁置一旁,认为一份保险合

2025-09-29 16:08:13

“鸡排哥”李俊永成景德镇文旅新名片:6元鸡排炸出“顶流”,承诺不碰预制菜

“鸡排哥”李俊永成景德镇文旅新名片:6元鸡排炸出“顶流”,承诺不碰预制菜

大皖新闻讯近日,江西景德镇摊主李俊永凭借“6元鸡排附赠600元情绪价值

2025-09-29 15:18:18

今热点:群众有了更多好去处!截至去年底全国共有公共图书馆3248个

今热点:群众有了更多好去处!截至去年底全国共有公共图书馆3248个

今天下午,国新办举行新闻发布会,介绍“十四五”时期文化和旅游高质量

2025-09-29 15:15:47

【新视野】农业农村部:9月29日“农产品批发价格200指数”比昨天下降0.05个点

【新视野】农业农村部:9月29日“农产品批发价格200指数”比昨天下降0.05个点

据农业农村部监测,9月29日“农产品批发价格200指数”为118 80,比昨天

2025-09-29 15:19:59

民生银行北京分行构建“大消保”格局 守护大众资金安全防线

民生银行北京分行构建“大消保”格局 守护大众资金安全防线

阿姨,这类所谓‘高回报’理财,其实就是典型的诈骗陷阱。在民生银行北京分行一网点的反诈沙龙现场,银行工作人员...

2025-09-29 14:37:59

当前焦点!港股异动 | 内险股午后涨幅扩大 预定利率调整催化8月寿险销售 长端利率上行有助缓解配置压力

当前焦点!港股异动 | 内险股午后涨幅扩大 预定利率调整催化8月寿险销售 长端利率上行有助缓解配置压力

智通财经APP获悉,内险股午后涨幅扩大,截至发稿,新华保险(01336)涨6

2025-09-29 14:08:06

银行对个人财务管理有哪些帮助? 速读

银行对个人财务管理有哪些帮助? 速读

在个人财务管理方面,银行扮演着至关重要的角色,能为个人提供多维度的

2025-09-29 14:03:00

哈尔滨市图书馆招聘硕博,每月薪资三千至四千?人事部门:岗位带编,参照事业单位标准_播资讯

哈尔滨市图书馆招聘硕博,每月薪资三千至四千?人事部门:岗位带编,参照事业单位标准_播资讯

哈尔滨市图书馆招聘硕博,每月薪资三千至四千?人事部门:岗位带编,参

2025-09-29 13:26:08

光影千年,影戏传情!苏州相城黄桥街道举办传统皮影戏表演活动 焦点热文

光影千年,影戏传情!苏州相城黄桥街道举办传统皮影戏表演活动 焦点热文

光影千年,影戏传情!苏州相城黄桥街道举办传统皮影戏表演活动

2025-09-29 13:28:27

速读:涨停雷达:铜基新材料+PCB+半年报增长 江南新材触及涨停

速读:涨停雷达:铜基新材料+PCB+半年报增长 江南新材触及涨停

今日走势:江南新材(603124)今日触及涨停板,该股近一年涨停9次。异

2025-09-29 13:24:08

瞄准高附加值赛道,新大正拟拿下嘉信立恒75%股权,IFM业务能否成其“救命稻草”?

瞄准高附加值赛道,新大正拟拿下嘉信立恒75%股权,IFM业务能否成其“救命稻草”?

瞄准高附加值赛道,新大正拟拿下嘉信立恒75%股权,IFM业务能否成其“救

2025-09-29 12:46:11

中国心连心化肥午前涨逾7% 公司持续推进战略布局落地

中国心连心化肥午前涨逾7% 公司持续推进战略布局落地

中国心连心化肥午前涨逾7%公司持续推进战略布局落地

2025-09-29 12:58:04

从基坑开挖到竣工验收:工程险如何为不同施工阶段 “保驾护航”

从基坑开挖到竣工验收:工程险如何为不同施工阶段 “保驾护航”

工程建设是一场 持久战,从基坑开挖的破土动工,到主体结构的拔地而起,再到设备安装的精细操作,最后到竣工验收的尘埃落定...

2025-09-15 10:23:00

观察:奥特佳:目前在机器人领域尚无产品和收入

观察:奥特佳:目前在机器人领域尚无产品和收入

此页面是否是列表页或首页?未找到合适正文内容。

2025-09-29 12:17:21

铜业股早盘延续近期涨势 中国有色矿业涨近5%洛阳钼业涨近4%

铜业股早盘延续近期涨势 中国有色矿业涨近5%洛阳钼业涨近4%

铜业股早盘延续近期涨势中国有色矿业涨近5%洛阳钼业涨近4%

2025-09-29 11:53:53

焦点消息!新东方-S午前涨超5% 大和将目标价由43港元上调至49港元

焦点消息!新东方-S午前涨超5% 大和将目标价由43港元上调至49港元

新东方-S午前涨超5%大和将目标价由43港元上调至49港元

2025-09-29 11:55:08

独家资金:早盘主力进散户逃前10股|快讯

独家资金:早盘主力进散户逃前10股|快讯

9月29日大单净量前十名个股如下:DDE大单净量=DDE大单净流入量 流通股

2025-09-29 11:22:59

热议:涨停雷达:固态电池+电解液龙头+80万吨长单+H股申请 天赐材料触及涨停

热议:涨停雷达:固态电池+电解液龙头+80万吨长单+H股申请 天赐材料触及涨停

今日走势:天赐材料(002709)今日触及涨停板,该股近一年涨停9次。异

2025-09-29 11:27:45

【时快讯】生意社:9月28日福建龙氟无水氟化氢价格动态

【时快讯】生意社:9月28日福建龙氟无水氟化氢价格动态

9月28日,福建龙氟11 5万吨产能装置共4条线,目前装置三线开工,后期预

2025-09-29 11:05:59

热门:以数智为翼,助力高质量发展——鹏扬基金数字化转型实践

热门:以数智为翼,助力高质量发展——鹏扬基金数字化转型实践

以数智为翼,助力高质量发展——鹏扬基金数字化转型实践

2025-09-29 10:53:04

广东省东莞市发改委关于废止《东莞市天然气汽车加气站建设工作流程》的通告

广东省东莞市发改委关于废止《东莞市天然气汽车加气站建设工作流程》的通告

广东省东莞市发改委关于废止《东莞市天然气汽车加气站建设工作流程》的

2025-09-29 10:29:08