月別アーカイブ: 2025年5月

Do Large Language Models Excel in Complex Logical Reasoning with Formal Language?

要約 大規模な言語モデル(LLM)は、複雑な論理推論タスクで画期的なパフォーマン … 続きを読む

カテゴリー: cs.AI, cs.CL | Do Large Language Models Excel in Complex Logical Reasoning with Formal Language? はコメントを受け付けていません

Guided Diffusion Sampling on Function Spaces with Applications to PDEs

要約 PDEベースの逆問題における条件付きサンプリングのための一般的なフレームワ … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.NA, math.NA, stat.ML | Guided Diffusion Sampling on Function Spaces with Applications to PDEs はコメントを受け付けていません

R1-Searcher++: Incentivizing the Dynamic Knowledge Acquisition of LLMs via Reinforcement Learning

要約 大規模な言語モデル(LLM)は強力ですが、静的な知識のために幻覚を起こしや … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR | R1-Searcher++: Incentivizing the Dynamic Knowledge Acquisition of LLMs via Reinforcement Learning はコメントを受け付けていません

Understanding Prompt Tuning and In-Context Learning via Meta-Learning

要約 プロンプトは、タスクをターゲットにするために優先モデルを適応させる主な方法 … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ML | Understanding Prompt Tuning and In-Context Learning via Meta-Learning はコメントを受け付けていません

InSTA: Towards Internet-Scale Training For Agents

要約 Webナビゲーションエージェントをトレーニングするための主なアプローチは、 … 続きを読む

カテゴリー: cs.AI, cs.LG | InSTA: Towards Internet-Scale Training For Agents はコメントを受け付けていません

Perceptual Quality Assessment for Embodied AI

要約 具体化されたAIは近年急速に発達していますが、それでも主に研究所に展開され … 続きを読む

カテゴリー: cs.CV, cs.RO | Perceptual Quality Assessment for Embodied AI はコメントを受け付けていません

Action2Dialogue: Generating Character-Centric Narratives from Scene-Level Prompts

要約 シーンベースのビデオ生成の最近の進歩により、システムは構造化されたプロンプ … 続きを読む

カテゴリー: cs.CV | Action2Dialogue: Generating Character-Centric Narratives from Scene-Level Prompts はコメントを受け付けていません

Retrieval-Augmented Perception: High-Resolution Image Perception Meets Visual RAG

要約 高解像度(HR)画像認識は、マルチモーダル大手言語モデル(MLLM)の重要 … 続きを読む

カテゴリー: cs.CL, cs.CV | Retrieval-Augmented Perception: High-Resolution Image Perception Meets Visual RAG はコメントを受け付けていません

DongbaMIE: A Multimodal Information Extraction Dataset for Evaluating Semantic Understanding of Dongba Pictograms

要約 Dongbaの絵文字は、世界でまだ使用されている唯一の絵文字スクリプトです … 続きを読む

カテゴリー: cs.CV | DongbaMIE: A Multimodal Information Extraction Dataset for Evaluating Semantic Understanding of Dongba Pictograms はコメントを受け付けていません

From EduVisBench to EduVisAgent: A Benchmark and Multi-Agent Framework for Pedagogical Visualization

要約 拡散モデルや大規模な視覚言語モデル(LVLMS)などの基礎モデル(FMS) … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | From EduVisBench to EduVisAgent: A Benchmark and Multi-Agent Framework for Pedagogical Visualization はコメントを受け付けていません