cs.AI」カテゴリーアーカイブ

VRBench: A Benchmark for Multi-Step Reasoning in Long Narrative Videos

要約 大規模なモデルのマルチステップ推論機能を評価するために作成された最初の長い … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | VRBench: A Benchmark for Multi-Step Reasoning in Long Narrative Videos はコメントを受け付けていません

Latent Action Learning Requires Supervision in the Presence of Distractors

要約 最近、Latent Action Policies(LAPO)によって開拓 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Latent Action Learning Requires Supervision in the Presence of Distractors はコメントを受け付けていません

Q-Ponder: A Unified Training Pipeline for Reasoning-based Visual Quality Assessment

要約 最近の研究では、マルチモーダルの大手言語モデル(MLLM)が解釈可能な評価 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | Q-Ponder: A Unified Training Pipeline for Reasoning-based Visual Quality Assessment はコメントを受け付けていません

AIR: Zero-shot Generative Model Adaptation with Iterative Refinement

要約 ゼロショット生成モデル適応(ZSGM)は、テキストガイダンスのみを使用して … 続きを読む

カテゴリー: cs.AI, cs.CV | AIR: Zero-shot Generative Model Adaptation with Iterative Refinement はコメントを受け付けていません

Object-Centric Latent Action Learning

要約 具体化されたAIの膨大な量の非標識インターネットビデオデータを活用すること … 続きを読む

カテゴリー: cs.AI, cs.CV | Object-Centric Latent Action Learning はコメントを受け付けていません

M4V: Multi-Modal Mamba for Text-to-Video Generation

要約 テキストからビデオへの生成は、コンテンツの作成を大幅に濃縮しており、強力な … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | M4V: Multi-Modal Mamba for Text-to-Video Generation はコメントを受け付けていません

Visually Descriptive Language Model for Vector Graphics Reasoning

要約 大きな進歩にもかかわらず、大規模なマルチモーダルモデル(LMM)は、形状、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Visually Descriptive Language Model for Vector Graphics Reasoning はコメントを受け付けていません

VINCIE: Unlocking In-context Image Editing from Video

要約 コンテキスト内画像編集は、テキストと以前に生成された画像を含むコンテキスト … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | VINCIE: Unlocking In-context Image Editing from Video はコメントを受け付けていません

ReGuidance: A Simple Diffusion Wrapper for Boosting Sample Quality on Hard Inverse Problems

要約 逆の問題を解決するための情報に基づいたデータ事前に、より一般的には報酬モデ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | ReGuidance: A Simple Diffusion Wrapper for Boosting Sample Quality on Hard Inverse Problems はコメントを受け付けていません

SpectralAR: Spectral Autoregressive Visual Generation

要約 自己回帰視覚生成は、拡散モデルと比較して、そのスケーラビリティと他のモダリ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | SpectralAR: Spectral Autoregressive Visual Generation はコメントを受け付けていません