月別アーカイブ: 2025年5月

MineAnyBuild: Benchmarking Spatial Planning for Open-world AI Agents

投稿日: 2025年5月28日作成者: jarxiv

要約空間計画は、空間インテリジェンスの分野で重要な部分であり、空間の観点からの … 続きを読む →

カテゴリー: cs.AI | コメントを受け付けていません

TrojanStego: Your Language Model Can Secretly Be A Steganographic Privacy Leaking Agent

投稿日: 2025年5月28日作成者: jarxiv

要約大規模な言語モデル（LLM）がデリケートなワークフローに統合されると、懸念 … 続きを読む →

カテゴリー: cs.CL, cs.CR | コメントを受け付けていません

Monocle: Hybrid Local-Global In-Context Evaluation for Long-Text Generation with Uncertainty-Based Active Learning

投稿日: 2025年5月28日作成者: jarxiv

要約入力の長さが増加するにつれてパフォーマンスの劣化により、高度なLLM-A- … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

EmoNet-Face: An Expert-Annotated Benchmark for Synthetic Emotion Recognition

投稿日: 2025年5月28日作成者: jarxiv

要約効果的な人間との相互作用は、人間の感情を正確に認識して解釈するAIの能力に … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

DiffVLA: Vision-Language Guided Diffusion Planning for Autonomous Driving

投稿日: 2025年5月28日作成者: jarxiv

要約エンドツーエンドの自律運転に関する研究の関心は、モジュラータスク、つまり、 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

Homophily Enhanced Graph Domain Adaptation

投稿日: 2025年5月28日作成者: jarxiv

要約グラフドメインの適応（GDA）は、ラベルのあるソースグラフからラベルの希少 … 続きを読む →

カテゴリー: cs.AI, cs.SI | コメントを受け付けていません

NoisyRollout: Reinforcing Visual Reasoning with Data Augmentation

投稿日: 2025年5月28日作成者: jarxiv

要約強化学習（RL）の最近の進歩により、視覚言語モデル（VLM）の推論能力が強 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

MLR-Bench: Evaluating AI Agents on Open-Ended Machine Learning Research

投稿日: 2025年5月27日作成者: jarxiv

要約 AIエージェントの最近の進歩は、科学的発見を推進し支援する彼らの可能性の高 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

DCG-SQL: Enhancing In-Context Learning for Text-to-SQL with Deep Contextual Schema Link Graph

投稿日: 2025年5月27日作成者: jarxiv

要約自然言語の質問をSQLクエリに変換するText-to-SQLは、大規模な言 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

RapidPoseTriangulation: Multi-view Multi-person Whole-body Human Pose Triangulation in a Millisecond

投稿日: 2025年5月27日作成者: jarxiv

要約マルチビューイメージングとポーズ推定の統合は、コンピュータービジョンアプリ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

月別アーカイブ: 2025年5月

MineAnyBuild: Benchmarking Spatial Planning for Open-world AI Agents

TrojanStego: Your Language Model Can Secretly Be A Steganographic Privacy Leaking Agent

Monocle: Hybrid Local-Global In-Context Evaluation for Long-Text Generation with Uncertainty-Based Active Learning

EmoNet-Face: An Expert-Annotated Benchmark for Synthetic Emotion Recognition

DiffVLA: Vision-Language Guided Diffusion Planning for Autonomous Driving

Homophily Enhanced Graph Domain Adaptation

NoisyRollout: Reinforcing Visual Reasoning with Data Augmentation

MLR-Bench: Evaluating AI Agents on Open-Ended Machine Learning Research

DCG-SQL: Enhancing In-Context Learning for Text-to-SQL with Deep Contextual Schema Link Graph

RapidPoseTriangulation: Multi-view Multi-person Whole-body Human Pose Triangulation in a Millisecond

最近の投稿

最近のコメント

アーカイブ

カテゴリー