中國人工智慧新創 DeepSeek 宣布推出升級版 DeepSeek-V3.1 模型,不僅在處理速度上有所提升,還具備針對國產晶片的最佳化功能。
根據公司公告,DeepSeek-V3.1 採用 UE8M0 FP8 精度格式,這是一種 8 位元浮點數運算方式,可在降低記憶體佔用的同時提升運行效率,並已針對「即將推出的下一代國產晶片」進行設計。FP8 被視為新一代 AI 模型的關鍵資料處理格式,能在相同硬體條件下加速訓練與推理。
由於美國出口限制,中國企業難以取得 NVIDIA H20 等閹割版 GPU,因此 DeepSeek 也開始調整模型架構,以配合未來國產晶片的發展。此次升級同時引入 混合推理架構,用戶可透過官方平台的「深度思考」按鈕自由切換思考與非思考模式。
此外,DeepSeek 表示,經過「思維鏈壓縮訓練」後,V3.1-Think 模型在各項任務的平均表現與 R1-0528 大致相當,但輸出 token 數減少 20% 至 50%,展現更高的運算效率。
(Source:Deepseek)
DeepSeek 今年以低成本 AI 模型震撼市場,被視為中國對抗西方技術的代表。此次 V3.1 升級凸顯公司正推動 AI 模型與本土半導體的深度結合,以減少對美國技術的依賴,並鞏固中國在新興 AI 生態中的自主優勢。不過,公司並未透露支援的晶片型號或製造商。
(首圖來源:DeepSeek )
文章看完覺得有幫助,何不給我們一個鼓勵
請我們喝杯咖啡您的咖啡贊助將是讓我們持續走下去的動力
總金額共新臺幣 0 元 《關於請喝咖啡的 Q & A》 取消 確認(责任编辑:陈珊妮)
纳斯达克当地时间9月3日宣布提议修改上市标准,正将拟议规则提交给美国证监会审核,若获批将立即实施...[详细]
他心心念念最想看的阅兵式,北京的肯定最威武。...[详细]
军事专家王云飞在接受《环球时报》记者采访时介绍称。...[详细]习近平同巴西联邦共和国总统举行会谈 两国元首一致同意推动中巴全面战略伙伴关系取得新的更大发展
中国国防部此前曾多次发布通报,中国在境内进行了陆基中段反导拦截技术试验,试验达到预期目的。...[详细]
视觉中国资料图据微信公众号南昌人大消息,9月2日,南昌市第十六届人民代表大会常务委员会第三十四次会议通过《南昌市人民代表大会常务委员会关于将八一广场中央圆心处确定为南昌市城市原点的决定》,决定将八一广...[详细]
单一反无人机装备有其局限性,此次展示的反无装备包括三种类型,这表明我国的反无作战装备成体系建设。...[详细]
首次亮相的长剑-1000巡航导弹有着更加丰富的内涵。...[详细]
美加墨世界杯首席运营官海莫·席尔吉表示,球票票价将根据市场情况进行动态调整。...[详细]
中国将自己视为战后秩序的守护者,向全球南方展现自己是一个稳定因素。...[详细]
新华社记者孟涛摄《环球时报》记者还注意到,在100支援战车的后部携带有一架车载旋翼无人机。...[详细]