在当今AI大模型(LLM)席卷全球的背景下,出现了一个全新的职业——提示词工程师(Prompt Engineer)。无数人们在Github上寻找“咒语”,在Discord里分享“秘籍”,试图通过复杂的结构化Prompt来驯服AI。这一现象被一些人视为一种工程技术,甚至是一种需要运气的“玄学”。然而,如果我们跳出代码和参数的视角,回归到大模型的本质——语言,我们会发现,早在一个世纪前,哲学家路德维希 ...
其核心思想是借鉴计算机科学中的“外存算法” (Out-of-core algorithms),不要把长 Prompt 直接喂给神经网络,而是把它放在一个外部的 Python REPL 环境里。 Prompt 被加载为环境中的变量context 。模型不再像以前那样生吞整个字符串,而是通过编写代码(如len (context) , context.split , re.search )来按需读取数据 ...
近日,一封由 AI 系统生成的感谢邮件在技术圈引发广泛关注和讨论。Python 之父 Guido van Rossum 对收到的邮件回应一句「Stop」,React 核心团队成员、Redux 作者 Dan Abramov 则投诉称“垃圾邮件泛滥”。
腾讯微信 AI 团队提出 WeDLM(WeChat Diffusion Language Model),通过在标准因果注意力下实现扩散式解码,在数学推理等任务上实现相比 vLLM 部署的 AR 模型 3 倍以上加速,低熵场景更可达 10 ...
scons ( 2.3.0 ) ant ( 1.8.2 ) Python ( 2.7.3 ) PostgreSQL ( 9.3.4 ) Linux x86-64: g++ ( 4.3.4 ) gcc ( 4.3.4 ) make ( 3.81 ) kernel ( 3.0.13-0.27-default ) Linux PPC64: g++ ( 4.3.4 ) gcc ( 4.3.4 ) make ...
专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!数据质量决定了模型智能的上限,而DataFlow将数据准备从手工作坊升级为了自动化工 ...
这两天,科技圈和金融圈的朋友圈被 MiniMax 赴港上市的消息刷屏。作为大模型领域的明星独角兽,MiniMax 的“上岸”无疑给行业投下了一颗深水炸弹。 但比起资本市场的喧嚣,作为开发者,我更关心其产品底层实力的进化。
为了解决这个问题,研究者提出了一种名为 "Vibe Reasoning"(直觉推理/氛围推理) 的新方法。通过Vibe ...
单个字符对大模型来说意义有限,使用GPT系列的Llama系列的tokenizer就会发现, 20个字符的问题,在不同AI眼中是10-13个token。
这一次,它直接甩出了一份硬核成绩单,在衡量多语言软件工程能力的Multi-SWE-bench榜单中,以仅10B的激活参数拿下了49.4%的成绩,超越了Claude Sonnet 4.5等国际顶尖竞品,拿下全球SOTA。
小黑盒游戏 on MSN
国内首个AI项目资源站发布! 代号Inferri! 收录3800个顶级项目!
【本文由小黑盒作者@idea小时于12月30日发布,转载请标明出处!】 Introducing Inferri: Navigate the AGI Era. Inferri官网 互联网上每天诞生成百上千个 AI ...
就在昨天,新加坡国立大学、中国人民大学、复旦大学等多所顶尖机构联合发布了一篇AI Agent 记忆(Memory)综述。 当前的 LLM 应用开发正面临严重的“记忆碎片化”问题:我们有用于短期记忆的 KV Cache,有用于知识检索的 RAG,还有用于长期交互的 MemGPT 类架构,但缺乏统一的理论指导。这篇综述不仅是对现有工作的盘点,更是一份解决“灾难性遗忘”与“上下文溢出”的系统方案。它详细 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果