「cs.AI」カテゴリーアーカイブ

Zero-shot Autonomous Microscopy for Scalable and Intelligent Characterization of 2D Materials

投稿日: 2025年4月15日作成者: jarxiv

要約原子スケール材料の特性評価では、伝統的に、数ヶ月から長年の専門的なトレーニ … 続きを読む →

カテゴリー: cond-mat.mes-hall, cond-mat.mtrl-sci, cs.AI, cs.CV, cs.LG | コメントを受け付けていません

GAF: Gaussian Avatar Reconstruction from Monocular Videos via Multi-view Diffusion

投稿日: 2025年4月15日作成者: jarxiv

要約スマートフォンなどのコモディティデバイスが撮影した単眼動画から、アニメーシ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.GR | コメントを受け付けていません

FingER: Content Aware Fine-grained Evaluation with Reasoning for AI-Generated Videos

投稿日: 2025年4月15日作成者: jarxiv

要約ビデオ生成における最近の進歩は、特にますます洗練されたモデルの出現により、 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Multimodal Long Video Modeling Based on Temporal Dynamic Context

投稿日: 2025年4月15日作成者: jarxiv

要約大規模な言語モデル（LLMS）の最近の進歩により、ビデオ理解の大きなブレー … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | コメントを受け付けていません

Learning Free Token Reduction for Multi-Modal Large Language Models

投稿日: 2025年4月15日作成者: jarxiv

要約ビジョン言語モデル（VLM）は、さまざまなマルチモーダルタスクで顕著な成功 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

RealWebAssist: A Benchmark for Long-Horizon Web Assistance with Real-World Users

投稿日: 2025年4月15日作成者: jarxiv

要約長老のWebベースのタスクで成功した支援を達成するには、AIエージェントは … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Visual Chronicles: Using Multimodal LLMs to Analyze Massive Collections of Images

投稿日: 2025年4月15日作成者: jarxiv

要約マルチモーダルLLMS（MLLM）を使用してシステムを提示して、時間的変化 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.CY | コメントを受け付けていません

Task Memory Engine (TME): A Structured Memory Framework with Graph-Aware Extensions for Multi-Step LLM Agent Tasks

投稿日: 2025年4月15日作成者: jarxiv

要約大規模な言語モデル（LLM）は、マルチステップタスクの自律エージェントとし … 続きを読む →

カテゴリー: 68T05, cs.AI, cs.CL, H.3.3 | コメントを受け付けていません

Hands-On: Segmenting Individual Signs from Continuous Sequences

投稿日: 2025年4月15日作成者: jarxiv

要約この作業は、手話の翻訳とデータ注釈に大きな影響を与える重要なタスクである、 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Large language models could be rote learners

投稿日: 2025年4月15日作成者: jarxiv

要約複数選択の質問（MCQ）ベンチマークは、大規模な言語モデル（LLM）の評価 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

Zero-shot Autonomous Microscopy for Scalable and Intelligent Characterization of 2D Materials

GAF: Gaussian Avatar Reconstruction from Monocular Videos via Multi-view Diffusion

FingER: Content Aware Fine-grained Evaluation with Reasoning for AI-Generated Videos

Multimodal Long Video Modeling Based on Temporal Dynamic Context

Learning Free Token Reduction for Multi-Modal Large Language Models

RealWebAssist: A Benchmark for Long-Horizon Web Assistance with Real-World Users

Visual Chronicles: Using Multimodal LLMs to Analyze Massive Collections of Images

Task Memory Engine (TME): A Structured Memory Framework with Graph-Aware Extensions for Multi-Step LLM Agent Tasks

Hands-On: Segmenting Individual Signs from Continuous Sequences

Large language models could be rote learners

最近の投稿

最近のコメント

アーカイブ

カテゴリー