月別アーカイブ: 2025年5月

MineAnyBuild: Benchmarking Spatial Planning for Open-world AI Agents

要約 空間計画は、空間インテリジェンスの分野で重要な部分であり、空間の観点からの … 続きを読む

カテゴリー: cs.AI | MineAnyBuild: Benchmarking Spatial Planning for Open-world AI Agents はコメントを受け付けていません

TrojanStego: Your Language Model Can Secretly Be A Steganographic Privacy Leaking Agent

要約 大規模な言語モデル(LLM)がデリケートなワークフローに統合されると、懸念 … 続きを読む

カテゴリー: cs.CL, cs.CR | TrojanStego: Your Language Model Can Secretly Be A Steganographic Privacy Leaking Agent はコメントを受け付けていません

Monocle: Hybrid Local-Global In-Context Evaluation for Long-Text Generation with Uncertainty-Based Active Learning

要約 入力の長さが増加するにつれてパフォーマンスの劣化により、高度なLLM-A- … 続きを読む

カテゴリー: cs.CL | Monocle: Hybrid Local-Global In-Context Evaluation for Long-Text Generation with Uncertainty-Based Active Learning はコメントを受け付けていません

EmoNet-Face: An Expert-Annotated Benchmark for Synthetic Emotion Recognition

要約 効果的な人間との相互作用は、人間の感情を正確に認識して解釈するAIの能力に … 続きを読む

カテゴリー: cs.AI, cs.CV | EmoNet-Face: An Expert-Annotated Benchmark for Synthetic Emotion Recognition はコメントを受け付けていません

DiffVLA: Vision-Language Guided Diffusion Planning for Autonomous Driving

要約 エンドツーエンドの自律運転に関する研究の関心は、モジュラータスク、つまり、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | DiffVLA: Vision-Language Guided Diffusion Planning for Autonomous Driving はコメントを受け付けていません

Homophily Enhanced Graph Domain Adaptation

要約 グラフドメインの適応(GDA)は、ラベルのあるソースグラフからラベルの希少 … 続きを読む

カテゴリー: cs.AI, cs.SI | Homophily Enhanced Graph Domain Adaptation はコメントを受け付けていません

NoisyRollout: Reinforcing Visual Reasoning with Data Augmentation

要約 強化学習(RL)の最近の進歩により、視覚言語モデル(VLM)の推論能力が強 … 続きを読む

カテゴリー: cs.CV | NoisyRollout: Reinforcing Visual Reasoning with Data Augmentation はコメントを受け付けていません

MLR-Bench: Evaluating AI Agents on Open-Ended Machine Learning Research

要約 AIエージェントの最近の進歩は、科学的発見を推進し支援する彼らの可能性の高 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | MLR-Bench: Evaluating AI Agents on Open-Ended Machine Learning Research はコメントを受け付けていません

DCG-SQL: Enhancing In-Context Learning for Text-to-SQL with Deep Contextual Schema Link Graph

要約 自然言語の質問をSQLクエリに変換するText-to-SQLは、大規模な言 … 続きを読む

カテゴリー: cs.AI, cs.CL | DCG-SQL: Enhancing In-Context Learning for Text-to-SQL with Deep Contextual Schema Link Graph はコメントを受け付けていません

RapidPoseTriangulation: Multi-view Multi-person Whole-body Human Pose Triangulation in a Millisecond

要約 マルチビューイメージングとポーズ推定の統合は、コンピュータービジョンアプリ … 続きを読む

カテゴリー: cs.CV | RapidPoseTriangulation: Multi-view Multi-person Whole-body Human Pose Triangulation in a Millisecond はコメントを受け付けていません