EN
www.4000871428.com

成色18k.8.35mb菠萝微软推出深度视频探索智能体,登顶多个长视频理解基准

尽管大型语言模型(LLMs)和大型视觉 - 语言模型(VLMs)在视频分析和长语境处理方面取得了显著进展,但它们在处理信息密集的数小时长视频时仍显示出局限性。 本文提出了一种新颖的智能体 Deep Video Discovery (DVD),通过将长视频分割为更短的片段并将其视作环境,利用 LLM 先进的推理能力来思考问题并自主规划,选择具有适当参数的工具来从环境中逐步获取信息,最终回答问题。在最新的推理模型OpenAI o3的帮助下, DVD以这一简洁有效的 agentic 框架在非常具有挑战性的LVBench上以74.2%的准确率大幅超越了之前的工作。这一工作将以MCP Server的形式开源。 不同于之前的视频智能体框架依赖于手动设计的固定工作流程,DVD 强调其作为智能体的自主性,即通过自主规划,决策和行动来解决问题。 为了充分利用这一自主性,我们将原始的长视频转换为多粒度视频数据库,并提供了一套以搜索为中心的工具使得智能体在不同阶段搜集不同粒度的信息。具体来说该系统主要由三个核心组件构成:多粒度视频数据库、以搜索为中心的工具集以及作为智能体协调器的 LLM。 在 “多粒度视频数据库构建” 阶段,系统将超长视频转换为一个结构化数据库,通过统一将视频分割成短片段(例如 5 秒),并提取全局、片段和帧级别的多粒度信息,包括主题中心化摘要、片段字幕及其嵌入向量,以及原始解码帧...。 (2)片段搜索(Clip Search)工具,实现通过片段描述 Embedding 对视频内容进行高效语义检索,并返回排名靠前的相关视频片段及其字幕和时间范围。 LLM 作为核心认知驱动器,在迭代的 “观察 - 推理 - 行动” 循环中,根据累积的知识和推理证据采取行动,从而赋予智能体自主、证据引导和灵活的行动机制,有效地将原始查询分解为逐步细化的子查询来解答问题。 该系统在多个长视频基准测试上进行了全面评估,展现了其卓越的效率和强大的性能。在极具挑战性的 LVBench 数据集上,DVD 智能体取得了 74.2% 的最新准确率,大幅超越了所有现有工作,包括先前的最先进模型 MR. Video(13.4% 的提升)和 VCA(32.9% 的提升)。在辅助转录的帮助下,准确率进一步提高到 76.0%。在 LongVideoBench、Video MME Long 子集和 EgoSchema 等其他长视频基准测试中,DVD 也持续超越了先前的最先进性能。 图 3:不同基础模型在智能体中的行为分析。图中可以明显看出不同基础模型表现出显著的行为模式差异,不具有推理能力 GPT-4o 表现出非常单一的行为模型。 消融研究证实了工具设计的有效性,并强调了推理模型在整个智能体系统中的关键作用:更换推理模型(如使用 OpenAI o4-mini 或 GPT-4o)会导致性能下降,这表明 LLM 推理能力的缺失会导致智能体行为崩溃。对智能体推理行为的分析也揭示了不同模型在工具调用模式、推理深度和准确性之间的关联,例如 GPT-4o 表现出过度自信和行为崩溃,倾向于过早结束推理。这些行为模式的分析进一步为未来的智能体设计以及基础语言模型的发展提供了实践参考。

成色18k.8.35mb菠萝
成色18k.8.35mb菠萝集中反馈的通稿提到,中央巡视组还收到反映一些领导干部的问题线索,已按规定转中央纪委国家监委机关、中央组织部等有关方面处理。然而在最近几个小时里,佛罗伦萨在争夺这位波黑前锋的竞争中后来居上,正逐步反超博洛尼亚——虽然后者在谈判当中仍被视为有力竞争者,即将成为佛罗伦萨主教练的皮奥利以及体育总监普拉德的赏识也使得这次反超成为可能。成色18k.8.35mb菠萝www.8x8x.gov.cn北京时间6月26日,昨夜今晨,足坛又有新的重大事件发生。多特世俱杯头名出线,C罗即将与利雅得胜利续约,欧青赛决赛对阵出炉。北京时间6月16日,来自意大利记者西蒙尼-托尼亚的报道指出,在国际米兰世俱杯首战临近的情况下,目前他们阵中依然有5名球员在进行单独训练。
20251207 👀 成色18k.8.35mb菠萝王弘毅在鹅剧派对上与孟子义的互动,和去年与女演员黄羿的互动对比,被部分网友吐槽“看人下菜碟”。当晚,王弘毅学孟子义的合照排序方式,被认为是回应“看人下菜碟”的争议。www.8x8x.gov.cn在苹果分享的一个配套 YouTube 视频中,喜剧演员马丁・赫利希(Martin Herlihy)向一群高中生展示了如何有效地使用“家长演示文稿”。就是这个视频,现在已被隐藏。
成色18k.8.35mb菠萝
📸 陈强记者 李萌 摄
20251207 👅 成色18k.8.35mb菠萝5月1日晚,有几户村民家里没有桶装水了,尝试饮用被污染的泉水,出现了腹泻、头痛等症状。毛嵩明告诉记者,5月2日,屯里组织了几辆车,把身体不适的村民送到附近医院就诊。病历显示,5月2日,多名谷里屯村民自诉饮用了不干净的水,到六塘镇中心卫生院急诊,被诊断为患肠胃炎等。77788.gov.cn而 Ladder Capital 不仅同意借款,还给了他极低的借款利率。一般情况下,美国商业地产贷款利率都在 5.5% 至 10% 之间徘徊,办公类资产会更高一些。在很长一段时间里,Ladder Capital 和德意志银行是美国总统最大的债权人,德意志银行给特朗普集团的利率在 5%~7% 之间,可见相比之下 Ladder Capital 给出的 3.67% 利率是极低的。
成色18k.8.35mb菠萝
📸 白培举记者 任卫荣 摄
🍆 寒假期间的一组数据印证着AI赋能的实效:90%的学生通过豆包等AI工具完成自主学习,那些曾在传统课堂中因羞于提问而积累的知识盲点,在智能体的即时交互中被逐一攻克。 这种“人机协作”模式, 让问题解决从单一依赖教师转向多元探索,学生在与AI的对话中,不仅获得知识解答,更学会了如何精准提问、深度思考。xjxjxj55.gov.cn
扫一扫在手机打开当前页