扎克伯格亲自宣布,PyTorch基金会已新鲜成立,并归入Linux基金会旗下。 PyTorch成功背后的驱动力,是开源社区充满活力的持续增长。成立基金会,将确保在今后许多年中,社区成员以透明和公开的方式作出决定。
近日,PyTorch 官方分享了如何实现无 CUDA 计算,对各个内核进行了微基准测试比较,并讨论了未来如何进一步改进 Triton 内核以缩小与 CUDA 的差距。 在做大语言模型(LLM)的训练、微调和推理时,使用英伟达的 GPU 和 CUDA 是常见的做法。在更大的机器学习编程与 ...
新智元报道 编辑:艾伦【新智元导读】谷歌正在推进一项代号为「TorchTPU」的战略行动,核心是让全球最主流的 AI 框架 PyTorch 在自家 TPU 芯片上跑得更顺畅。这项行动不仅是技术补课,更是一场商业围剿。作为 PyTorch 的掌控者,Meta ...
6月6日-7日,第七届北京智源大会在北京盛大召开。本届大会汇聚了4位图灵奖得主、30余位AI企业创始人&CEO、100余位全球青年科学家、200余位人工智能顶尖学者和产业专家。大会设置20个论坛共计180余场报告,覆盖多模态、深度推理、下一代AI路径、Agent智能体、具 ...
据 AIbase 报道,为了撼动英伟达在 AI 芯片领域的统治地位,Alphabet(谷歌母公司)正在推进一项名为“ TorchTPU ”的战略计划。该计划旨在显著提升其张量处理单元(TPU)芯片对 PyTorch 框架的兼容性,从而降低开发者从英伟达 GPU 切换至谷歌 TPU 的技术门槛和迁移成本。
快科技10月31日消息,摩尔线程宣布,针对PyTorch深度学习框架的MUSA插件“Torch-MUSA”,迎来重大更新新版本v1.3.0,全面兼容PyTorch 2.2.0。 新版进一步提升了PyTorch在摩尔线程GPU MUSA架构上的模型性能与覆盖度,能更友好地支持模型迁移到摩尔线程GPU。 PyTorch是全球 ...
网络安全研究人员近日发现,在HuggingFace平台上,有两个恶意机器学习(ML)模型利用了一种非常规的“损坏”pickle文件技术来规避安全检测。 研究人员Karlo Zanki表示:“从这些PyTorch存档中提取的pickle文件,在文件开头揭示了恶意的Python内容。两者的恶意载荷 ...
快科技9月25日消息,在2025年Computex大会上,AMD承诺将通过ROCm为Windows系统带来PyTorch支持,如今这一承诺终于兑现。 AMD发布了ROCm 6.4.4预览版本,为Windows系统下的Radeon RX 9000和RX 7000系列显卡以及Ryzen AI系列APU带来了PyTorch支持。 ROCm是由AMD开发的开源GPU计算生态系统 ...
AI自动生成的苹果芯片Metal内核,比官方的还要好? Gimlet Labs的最新研究显示,在苹果设备上,AI不仅能自动生成Metal内核,还较基线内核实现了87%的PyTorch推理速度提升。 更惊人的是,AI生成的Metal内核还在测试的215个PyTorch模块上实现了平均1.87倍的加速,其中一些 ...
PyTorch,这一广受欢迎的开源机器学习框架,近期正式推出了其最新版本——2.8版。此次版本更新聚焦于提升量化大语言模型(LLM)在Intel CPU上的推理性能,吸引了众多开发者和研究人员的目光。 在PyTorch 2.8中,开发者团队通过算法优化和技术革新,显著提高了 ...
知乎 on MSN
如何快速理解PyTorch自动梯度(Autograd)的原理?
核心原理似乎是一道编程题:在无环有向图(Directed Graph)中, 每个节点记录了所有前向节点。自动梯度相当于:从叶子结点出发,使用拓扑排序遍历所有父节点,每个节点上存有一个函数,当遍历该节点时,调用函数更新节点上的一个数值。 题中提到的“一个函数”是反向求导函数,“一个数值”即梯度。 原理大概就是这个,下面展开讲一下。 先看两个基本问题: ...
在本文里,将在AndesAIRE平台上实践自带模型(BYOM)流程,它是从模型开发、ONNX导出、API设计、交叉编译,到在RISC-V上部署与推论的完整流程。此流程展示了AndesAIRE I370平台在灵活整合外部模型与支持多元运行环境的优势。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果