-
最近の投稿
- A Hierarchical Reinforcement Learning Framework for Multi-UAV Combat Using Leader-Follower Strategy
- A 65 nm Bayesian Neural Network Accelerator with 360 fJ/Sample In-Word GRNG for AI Uncertainty Estimation
- Map Prediction and Generative Entropy for Multi-Agent Exploration
- Polyhedral Collision Detection via Vertex Enumeration
- Safe and Efficient Robot Action Planning in the Presence of Unconcerned Humans
-
最近のコメント
表示できるコメントはありません。 cs.AI (32657) cs.CL (24688) cs.CR (2523) cs.CV (38845) cs.LG (37527) cs.RO (19009) cs.SY (2906) eess.IV (4656) eess.SY (2900) stat.ML (4944)
「cs.AI」カテゴリーアーカイブ
A Hierarchical Reinforcement Learning Framework for Multi-UAV Combat Using Leader-Follower Strategy
要約 Multi-UAV航空戦闘は、航空宇宙と人工知能の両方で進化する分野である … 続きを読む
A 65 nm Bayesian Neural Network Accelerator with 360 fJ/Sample In-Word GRNG for AI Uncertainty Estimation
要約 不確実性の推定は、AI 対応の安全性が重要なアプリケーションにとって不可欠 … 続きを読む
Offline-to-online Reinforcement Learning for Image-based Grasping with Scarce Demonstrations
要約 オフラインからオンラインの強化学習(O2O RL)は、環境と相互作用する際 … 続きを読む
M3PT: A Transformer for Multimodal, Multi-Party Social Signal Prediction with Person-aware Blockwise Attention
要約 複数の当事者による会話におけるソーシャル シグナルを理解することは、人間と … 続きを読む
Zero-Shot Trajectory Planning for Signal Temporal Logic Tasks
要約 Signal Temporal Logic (STL) は、連続信号の複雑 … 続きを読む
Training-free Ultra Small Model for Universal Sparse Reconstruction in Compressed Sensing
要約 事前トレーニングされた大規模モデルは近年広く注目を集めていますが、物理セン … 続きを読む
Integrative Decoding: Improve Factuality via Implicit Self-consistency
要約 複数の出力を繰り返しサンプリングし、最終的な応答として最も一貫したものを選 … 続きを読む
URSA: Understanding and Verifying Chain-of-thought Reasoning in Multimodal Mathematics
要約 思考連鎖 (CoT) 推論は、大規模言語モデル (LLM) の数学的推論機 … 続きを読む
RETQA: A Large-Scale Open-Domain Tabular Question Answering Dataset for Real Estate Sector
要約 不動産市場は、物件の詳細、市場動向、価格変動などの構造化データに大きく依存 … 続きを読む
Cross-lingual Transfer of Reward Models in Multilingual Alignment
要約 ヒューマンフィードバックによる強化学習 (RLHF) は、正確な報酬モデル … 続きを読む