AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com ...
本文的主要作者来自复旦大学和南洋理工大学 S-Lab,研究方向聚焦于视觉推理与强化学习优化。 先进的多模态大模型(Large Multi-Modal Models, LMMs)通常基于大语言模型(Large Language Models, LLMs)结合原生分辨率视觉 Transformer(NaViT)构建。然而,这类模型在处理高 ...
本研究针对真实场景中跨域交通标志识别(TSR)的难题,提出跨域多步思维框架(CdMT),通过大模型(LMMs)的多步推理能力,结合上下文描述、特征描述和差异描述三重策略,在GTSRB等五个数据集上实现0.85-0.97的识别准确率,为零样本跨国家细粒度TSR提供了无需训练数据 ...
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com ...
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com ...
2025年5月,上海交通大学Ethan Chern、Zhulin Hu、Steffi Chern等研究者与复旦大学的Jiadi Su、Yan Ma以及上海交通大学的Zhijie Deng和Pengfei Liu共同发表了一篇突破性论文《Thinking with Generated Images》(用生成图像思考)。这篇发表在arXiv预印本平台(arXiv:2505.22525v1)的研究,为 ...
SoundFont2(简称sf2)是一种包含多个PCM音频采样的音源文件格式。每个sf2文件可容纳多种乐器音色。接下来将介绍如何在LMMS软件中加载并使用sf2音源,实现丰富多样的音乐合成与创作效果。 1、 打开软件后,把sf2 player插件拖入歌曲编辑界面即可。 4、 点击扳手 ...
本研究针对黄瓜叶坏死突变体(LMMs)的遗传机制展开,通过图位克隆技术定位并鉴定出关键基因CsPBGD(编码胆色素原脱氨酶PBGD)。来自中国的研究团队发现,该基因Ala314Val和Arg197Lys位点突变导致酶活性丧失,引发H2 O2 积累和程序性细胞死亡(PCD),同时显著增强对 ...