【新智元导读】一封内部信揭开了AI巨头们之间最尴尬的秘密。 2026年1月8日,一则消息在社交媒体上炸开了锅。 根据内部Slack泄露的消息,xAI联合创始人Tony Wu向全体员工发布了一则紧急通知: 各位同事,相信很多人已经发现,Cursor中的Claude(Anthropic)模型已无法响应。据Cursor反馈,这是Anthropic针对所有主要竞争对手实施的新政策。 这既是坏消息,也是好消 ...
如果你现在还把“写代码”这件事,和“要学一门编程语言、啃完几十小时课程、装一堆开发环境”绑在一起,那你大概率会被这个故事震一下。主角 Elena,本职是 AI 研究员:每天看论文、测模型、写报告,懂算法、懂模型原理,看 paper ...
当前AI的优势集中在新产品、新系统的从零开发,能够胜任小型网站和App应用的开发,但对于商业级复杂系统的接管,无论是业务逻辑衔接、数据处理安全性还是代码质量把控,都尚未达到企业可信任的程度。
数据公开后,以及《Nature》为此专门撰写的社论,标志着DeepSeek在学术严谨性和技术原创性上获得了国际最高认可,彻底洗刷了外界对于中国大模型“套壳”或“跟随”的刻板印象。
说到底,MIT这项关于递归语言模型的研究为我们展示了一种全新的AI工作方式。不再是让AI硬记所有信息,而是教会AI如何聪明地利用外部资源,如何分解复杂问题,如何进行有效的信息管理。这种方式不仅更加高效,也更加接近人类的思维模式。
DeepSeek-V4的技术亮点体现在对数据模式的理解能力上。以“数草莓中字母r的数量”这一经典问题为例,上一代模型因无法理解“计数”概念,只能依赖训练数据中的错误答案,导致频繁出错。而新模型通过改进训练机制,能够真正理解任务本质,避免此类低级错误。团队还攻克了“灾难性遗忘”问题——在模型复杂度提升的过程中,V4保持了性能稳定性,未出现能力退化现象,这为构建编程Agent奠定了基础。
去年7月,由于DeepSeek下载量从高峰期的8000多万暴跌至2000多万,下滑72.2%,“DeepSeek跌落神坛”就成为了当时互联网最热门的话题。 根据DeepSeek内部的基准测试,V4在编程任务上的表现超过了目前市场上的主流竞品,包括Anthropic的Claude和OpenAI的GPT系列。