在人工智能飞速发展的今天,能够同时理解图片和文字的多模态大语言模型(MLLMs)正在改变我们与机器交流的方式。不过,这些先进模型有个让人头疼的问题——运行起来实在太"吃资源"了,特别是处理高清图片时更是如此。最近,来自英国赫瑞-瓦特大学的研究团队在《机器学习研究汇刊》2025年11月刊上发表了一项突破性研究,提出了名为"Script"的创新方法,可以让这些" ...