综合精品久久,国产69精品久久久久99尤,国产精品久久久久久久久久大牛

DeepSeek R2沒等來，R1“小升級(jí)”發(fā)布：思考時(shí)間更長，效果如何？

來源：澎湃新聞

2025-05-29 16:32:00

澎湃新聞?dòng)浾?范佳來

DeepSeek低調(diào)升級(jí)，引發(fā)科技圈熱議。

5月28日，DeepSeek 在官方微信群發(fā)布消息稱，DeepSeek R1模型已完成“小版本試升級(jí)”，歡迎前往官方網(wǎng)頁、APP、小程序測(cè)試（打開深度思考），API 接口和使用方式保持不變。

不過，澎湃新聞?dòng)浾卟樵児俜骄W(wǎng)站等，發(fā)現(xiàn)沒有對(duì)此次更新的詳細(xì)信息。記者咨詢了一位DeepSeek內(nèi)部人士，對(duì)方回復(fù)稱是“小升級(jí)”。

根據(jù)Hugging Face，DeepSeek-R1此次開源版本為0528。

從宣傳來看，此次升級(jí)十分低調(diào)，不過，根據(jù)網(wǎng)友測(cè)評(píng)，此次升級(jí)可不是簡單的“小升級(jí)”。

有科技媒體分析稱，時(shí)隔4個(gè)月，DeepSeek-R1完成了超進(jìn)化，編碼能力強(qiáng)到離譜，而且思考時(shí)間更長了。據(jù)稱，新模型基于DeepSeek-V3-0324訓(xùn)練（參數(shù)為660B）。在LiveCodeBench基準(zhǔn)上，DeepSeek-R1-0528性能幾乎與o3-mini（High）和o4-mini（Medium)實(shí)力相當(dāng)，一舉超越了Gemini 2.5 Flash。

科技類網(wǎng)站“AIGC開放社區(qū)”的評(píng)論稱，在著名代碼測(cè)試平臺(tái)Live CodeBench中顯示，其性能可以媲美OpenAI最新的o3模型高版本。也有網(wǎng)友對(duì)新版R1的風(fēng)格進(jìn)行了測(cè)試，幾乎和OpenAI的o3差不多。

從社交媒體的反饋來看，網(wǎng)友最為關(guān)注的是此次DeepSeek R1更新后的思考時(shí)間變長。據(jù)測(cè)評(píng)顯示，此次DeepSeek單任務(wù)處理時(shí)長可達(dá)30-60分鐘。

此外，有網(wǎng)友通過實(shí)驗(yàn)對(duì)比了Claude-4-Sonnet與DeepSeek-R1-0528的實(shí)際表現(xiàn)。可以看到，DeepSeek-R1生成的代碼在模擬物理碰撞方面表現(xiàn)更好。

值得注意的是，此前有傳言稱，深度求索可能將在5月推出下一代AI大模型DeepSeek-R2。

有報(bào)道稱，DeepSeek-R2大模型將會(huì)采用一種更先進(jìn)的混合專家模型(MoE)，其結(jié)合更加智能的門控網(wǎng)絡(luò)層(Gating Network)以優(yōu)化高負(fù)載推理任務(wù)的性能。

不過，當(dāng)時(shí)有內(nèi)部人士向記者坦言，該傳言真實(shí)度不高。從目前的情況分析，DeepSeek或許將用此次R1版本的升級(jí)，取代R2版本的推出。

盡管網(wǎng)友評(píng)測(cè)得出的結(jié)論十分驚喜，但是也有業(yè)內(nèi)人士向記者表示，建議理性客觀看待，也期待更為權(quán)威的測(cè)評(píng)結(jié)果。

在DeepSeek R1發(fā)布更新后，遠(yuǎn)在大洋彼岸的AI巨頭英偉達(dá)（Nasdaq：NVDA）發(fā)布截至4月27日的2026財(cái)年第一財(cái)季財(cái)報(bào)，期內(nèi)實(shí)現(xiàn)營收440.62億美元，同比上漲69%，高于市場(chǎng)預(yù)期的432.8億美元；美國通用會(huì)計(jì)準(zhǔn)則（GAAP）下凈利潤187.75億美元，同比上漲26%。在財(cái)報(bào)電話會(huì)上，英偉達(dá)CEO黃仁勛再次談到DeepSeek所引發(fā)的市場(chǎng)對(duì)于推理模型的關(guān)注，以及推理模型會(huì)需要更大的算力支持，這將驅(qū)動(dòng)推理算力需求。

日日草日日干_免费看h网站_国产毛片在线_久久国产免费_成人18在线_欧美1