高跟丝袜 DeepSeek的一次小更新，堪比发布新模子。 - r级书屋狂师

r级书屋狂师

高跟丝袜 DeepSeek的一次小更新，堪比发布新模子。

发布日期：2025-03-27 12:24 点击次数：89

高跟丝袜 DeepSeek的一次小更新，堪比发布新模子。

The following article is from 差评前沿部 Author 世超高跟丝袜

一个好音问，时隔俩月， DeepSeek 终于更新了。

就在昨天晚上， DeepSeek 一声不吭往 Hugging Face 上扔了个 DeepSeek -V3-0324 模子。

模子参数 6850 亿，跟上一个版块的 V3 （ 6710 亿）收支不大，选拔 MoE 架构，还撑握了更通达的 MIT 开源契约。

字据官方更新的版块评释， DeepSeek -V3-0324 主如若针对推理才能和前端诞生才能进行了加强，写稿格调已矣了跟 R1 对王人，另外还有一些其他方面的小优化。

当前掀开 DeepSeek 官网，把深度想考形状关掉就能平直用上 V3-0324 。

不外有一说一，诚然 V3-0324 只是只是 V3 的小版块升级，并不是大伙儿期待已久的 V4 或者 R2 ，且官方账号也莫得发布任何跟模子相干的信息。

但也涓滴不妨碍， V3-0324 一上线，就有东谈主说他的代码才能，直追克劳德。

新版块的模子刚一上传，就登上了 Hugging Face 的趋势榜单。

在海外大模子竞技场 KCORES 的测评中， V3-0324 的代码才能得分 328.3 ，进步了普通版的 Claude 3.7 Sonnet 的 322.3 分，接近 Claude 3.7 Sonnet 想维链版块的 334.8 分，排行第三。

图源 @karminski 牙医

要点是，排行在前边的模子根柢就没几个开源免费的， V3-0324 可谓是轶群出众。

是以在 V3-0324 上线不到一天的时候里，就照旧有好多老哥迫不足待上手测评了一波。

这样说吧， V3-0324 在这些东谈主手里，照旧成了拳打 o3-mini ，脚踢 Claude 3.7 Sonnet 的存在。

经典的小球弹跳测试中，这位老哥把 V3-0324 、 o3-mini 和 R1 拉了个横评。

o3-mini 刚驱动看着还不赖，但推断物理没学好，外面的六边形都转到垂直的位置了，球还不知谈往下掉。

R1 的发达，亦然有些让东谈主恍依稀惚。。

相对来说， V3-0324 生成的后果是发达最佳的，这位老哥涓滴不惜啬对它的夸奖，说它 " 发达得像惟一溜名第一的非推理模子 " 。

让 V3-0324 生成一个网页，模子承接写了 800 多行代码，运行的时候还莫得出错，这什么实力毋庸多说了吧。

在挑剔区下面，有东谈主只是下达了编写登录页面的浅薄指示，并莫得任何其他的附加提醒，不异也生成了一个完好的登录页面。

还说 V3-0324 在编码上，能跟 Claude 3.7 Sonnet 掰一掰手腕。

更别提其他的模子，性价比各方面比拟下来，当前 OpenAI 的 o1-pro 和 GPT-4.5 ，都照旧不香了。

归正看了几个网友的测试案例之后，世超对 V3-0324 的前端代码生成才能，照旧有了初步的判断。

但不论咋说，没亲身上过手的东西，咱硬夸也有点胆小。是以此次世超也策画浅薄试一试，望望 V3-0324 到底有多能打。

一上来，世超就让模子作念了一个画板，提醒词是 " 帮我用 HTML 代码构建一个画板，撑握鼠标绘图、橡皮擦功能和脸色弃取 " ，此次出战的模子是 V3-0324 和普通版 Claude 3.7 Sonnet 。

只可说，这把 Claude 3.7 Sonnet 取得很透顶。光是有取色器这小数，就甩了 V3-0324 不知谈几个车尾灯。

更别提 UI 遐想了， V3-0324 作念出来的画板让世超不是很有创作的空想。。。

世超确凿是没料想，这盆凉水来得这样快，都让我有点怀疑到底是我的提醒词没写好，如故模子有问题了。。。

不外，我背面又不息把小球弹跳的提醒词，划分喂给了 DeepSeek-V3-0324 、普通版 Claude 3.7 Sonnet 还有 DeepSeek-V3 。

这下味儿终于对了。V3-0324 生成的后果确乎牛叉，能很明晰地看到小球鄙人落触底的时候，产生了小幅度的弹跳。

便是吧，老版块的 V3 根柢没运行起来。。。只可说两个版块之间的差距上下立判了。

再来看普通版 Claude 3.7 Sonnet 的后果，优点是下面的转速、重力和摩擦力都是可调遣的，弹跳看起来也没什么大问题，但小球有点出画面了。。。

临了，世超又划分让 V3 和 V3-0324 生成一个 Saas 登录页面，提醒词就一句话，莫得任何的附加信息。

不错看到， V3 的页面倒是作念出来了，但没什么遐想可言。

反不雅 V3-0324 ，竟然就跟官方的版块更新评释一样，生成的网页更好意思不雅了。

抽象看下来， V3-0324 的代码才能比拟 V3 确乎有了比较大的晋升，何况在一部分测试案例中，也简略并列普通版 Claude 3.7 Sonnet 。

但如果要说饱和超过 Claude 3.7 Sonnet ，那世超觉着暂时还不太行。

不外大伙儿也别忘了， V3-0324 在开源这个赛谈里， V3-0324 照旧算得上能打的了。

何况 DeepSeek 的 API 价钱业主打的一个低廉。世超对比了 Claude 3.7 Sonnet 和 V3-0324 的 API 价钱， V3-0324 百万 tokens 输入的价钱是 2 元，百万 tokens 输出的价钱是 8 元，而不异的 tokens 数， Claude 3.7 Sonnet 的输入和输出价钱划分是 36.6 元和 108.9 元，价差最多有 18 倍。

是以在某种过程上， V3-0324 这个小更新，真的不错跟 Claude 3.7 Sonnet 失色。

极度是今天晚上，DeepSeek 官方还发文，认真先容了这波小更新，在数学、代码类的相干评测上，V3-0324 比 OpenAI 当前最强横的非推理模子 GPT-4.5 都要更胜一筹。

前年 12 月底 V3 上线，紧接着 R1 就在过年的时候上桌吃饭了。如果按照 DeepSeek 之前发布模子的节拍，盲猜一波 R2 也快了。

总之，小版块更新的 V3-0324 就照旧如斯强悍了，便是不知谈，在 DeepSeek 横暴的开源炮弹下， " OpenAI 们 " 还遭不遭得住了。

撰文：西西

友情链接：

Powered by r级书屋狂师 @2013-2022 RSS地图 HTML地图

Copyright Powered by365站群 © 2013-2024

栏目分类

热点资讯

相关资讯