-
最近の投稿
- Towards Generalizable Vision-Language Robotic Manipulation: A Benchmark and LLM-guided 3D Policy
- Haptic-ACT: Bridging Human Intuition with Compliant Robotic Manipulation via Immersive VR
- Task-Aware Robotic Grasping by evaluating Quality Diversity Solutions through Foundation Models
- VDT-Auto: End-to-end Autonomous Driving with VLM-Guided Diffusion Transformers
- ViViDex: Learning Vision-based Dexterous Manipulation from Human Videos
-
最近のコメント
表示できるコメントはありません。 cs.AI (34550) cs.CL (26107) cs.CR (2648) cs.CV (40394) cs.LG (39550) cs.RO (20191) cs.SY (3066) eess.IV (4803) eess.SY (3060) stat.ML (5206)
「cs.AI」カテゴリーアーカイブ
Forecasting Frontier Language Model Agent Capabilities
要約 言語モデル(LM)が自律的なエージェントとして運用されるようになるにつれ、 … 続きを読む
Fuzzy Speculative Decoding for a Tunable Accuracy-Runtime Tradeoff
要約 投機的デコーディング(SD)は、ターゲットモデルとの厳密な分布的等価性を強 … 続きを読む
Structural-Entropy-Based Sample Selection for Efficient and Effective Learning
要約 サンプル選択は、有益で代表的なサンプルを提供することで、機械学習モデルの効 … 続きを読む
Representation Engineering: A Top-Down Approach to AI Transparency
要約 本稿では、認知神経科学の知見を活用し、AIシステムの透明性を向上させるアプ … 続きを読む
Cross-Spectral Vision Transformer for Biometric Authentication using Forehead Subcutaneous Vein Pattern and Periocular Pattern
要約 例えば、顔認証に基づくバイオメトリクスは、顔面マスクの着用により失敗し、指 … 続きを読む
RALAD: Bridging the Real-to-Sim Domain Gap in Autonomous Driving with Retrieval-Augmented Learning
要約 ロバストな自律走行システムの追求において、実世界のデータセットで学習された … 続きを読む
HiBug2: Efficient and Interpretable Error Slice Discovery for Comprehensive Model Debugging
要約 コンピュータビジョンにおけるディープラーニングモデルの大きな成功にもかかわ … 続きを読む
Improving Representation of High-frequency Components for Medical Visual Foundation Models
要約 基礎モデルは、多様な下流タスクにまたがる優れた一般化可能性から、近年大きな … 続きを読む