cs.AI」カテゴリーアーカイブ

Zero-shot Autonomous Microscopy for Scalable and Intelligent Characterization of 2D Materials

要約 原子スケール材料の特性評価では、伝統的に、数ヶ月から長年の専門的なトレーニ … 続きを読む

カテゴリー: cond-mat.mes-hall, cond-mat.mtrl-sci, cs.AI, cs.CV, cs.LG | Zero-shot Autonomous Microscopy for Scalable and Intelligent Characterization of 2D Materials はコメントを受け付けていません

GAF: Gaussian Avatar Reconstruction from Monocular Videos via Multi-view Diffusion

要約 スマートフォンなどのコモディティデバイスが撮影した単眼動画から、アニメーシ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR | GAF: Gaussian Avatar Reconstruction from Monocular Videos via Multi-view Diffusion はコメントを受け付けていません

FingER: Content Aware Fine-grained Evaluation with Reasoning for AI-Generated Videos

要約 ビデオ生成における最近の進歩は、特にますます洗練されたモデルの出現により、 … 続きを読む

カテゴリー: cs.AI, cs.CV | FingER: Content Aware Fine-grained Evaluation with Reasoning for AI-Generated Videos はコメントを受け付けていません

Multimodal Long Video Modeling Based on Temporal Dynamic Context

要約 大規模な言語モデル(LLMS)の最近の進歩により、ビデオ理解の大きなブレー … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | Multimodal Long Video Modeling Based on Temporal Dynamic Context はコメントを受け付けていません

Learning Free Token Reduction for Multi-Modal Large Language Models

要約 ビジョン言語モデル(VLM)は、さまざまなマルチモーダルタスクで顕著な成功 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Learning Free Token Reduction for Multi-Modal Large Language Models はコメントを受け付けていません

RealWebAssist: A Benchmark for Long-Horizon Web Assistance with Real-World Users

要約 長老のWebベースのタスクで成功した支援を達成するには、AIエージェントは … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | RealWebAssist: A Benchmark for Long-Horizon Web Assistance with Real-World Users はコメントを受け付けていません

Visual Chronicles: Using Multimodal LLMs to Analyze Massive Collections of Images

要約 マルチモーダルLLMS(MLLM)を使用してシステムを提示して、時間的変化 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.CY | Visual Chronicles: Using Multimodal LLMs to Analyze Massive Collections of Images はコメントを受け付けていません

Task Memory Engine (TME): A Structured Memory Framework with Graph-Aware Extensions for Multi-Step LLM Agent Tasks

要約 大規模な言語モデル(LLM)は、マルチステップタスクの自律エージェントとし … 続きを読む

カテゴリー: 68T05, cs.AI, cs.CL, H.3.3 | Task Memory Engine (TME): A Structured Memory Framework with Graph-Aware Extensions for Multi-Step LLM Agent Tasks はコメントを受け付けていません

Hands-On: Segmenting Individual Signs from Continuous Sequences

要約 この作業は、手話の翻訳とデータ注釈に大きな影響を与える重要なタスクである、 … 続きを読む

カテゴリー: cs.AI, cs.CV | Hands-On: Segmenting Individual Signs from Continuous Sequences はコメントを受け付けていません

Large language models could be rote learners

要約 複数選択の質問(MCQ)ベンチマークは、大規模な言語モデル(LLM)の評価 … 続きを読む

カテゴリー: cs.AI, cs.CL | Large language models could be rote learners はコメントを受け付けていません