如果你现在还把“写代码”这件事,和“要学一门编程语言、啃完几十小时课程、装一堆开发环境”绑在一起,那你大概率会被这个故事震一下。主角 Elena,本职是 AI 研究员:每天看论文、测模型、写报告,懂算法、懂模型原理,看 paper ...
【新智元导读】一封内部信揭开了AI巨头们之间最尴尬的秘密。 2026年1月8日,一则消息在社交媒体上炸开了锅。 根据内部Slack泄露的消息,xAI联合创始人Tony Wu向全体员工发布了一则紧急通知: 各位同事,相信很多人已经发现,Cursor中的Claude(Anthropic)模型已无法响应。据Cursor反馈,这是Anthropic针对所有主要竞争对手实施的新政策。 这既是坏消息,也是好消 ...
当前AI的优势集中在新产品、新系统的从零开发,能够胜任小型网站和App应用的开发,但对于商业级复杂系统的接管,无论是业务逻辑衔接、数据处理安全性还是代码质量把控,都尚未达到企业可信任的程度。
钛媒体APP on MSN
编程表现超越Claude和GPT? DeepSeek准备第二次震惊全世界
上市当天开盘235.4港元,涨了42.7%,之后一路飙升,盘中最高到351.8港元,最终收盘345港元,较发行价暴涨 109.09%,市值来到1054亿港元,成了千亿市值俱乐部新成员。
去年7月,由于DeepSeek下载量从高峰期的8000多万暴跌至2000多万,下滑72.2%,“DeepSeek跌落神坛”就成为了当时互联网最热门的话题。 根据DeepSeek内部的基准测试,V4在编程任务上的表现超过了目前市场上的主流竞品,包括Anthropic的Claude和OpenAI的GPT系列。
DeepSeek-V4的技术亮点体现在对数据模式的理解能力上。以“数草莓中字母r的数量”这一经典问题为例,上一代模型因无法理解“计数”概念,只能依赖训练数据中的错误答案,导致频繁出错。而新模型通过改进训练机制,能够真正理解任务本质,避免此类低级错误。团队还攻克了“灾难性遗忘”问题——在模型复杂度提升的过程中,V4保持了性能稳定性,未出现能力退化现象,这为构建编程Agent奠定了基础。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果