-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
CLIP with Generative Latent Replay: a Strong Baseline for Incremental Learning
要約 トランスフォーマーや CLIP などのビジョン言語モデル (VLM) の出 … 続きを読む
Learning Multi-modal Representations by Watching Hundreds of Surgical Video Lectures
要約 外科用コンピュータ ビジョンの最近の進歩は、言語セマンティクスを欠いた視覚 … 続きを読む
Stretching Each Dollar: Diffusion Training from Scratch on a Micro-Budget
要約 生成 AI のスケーリングの法則がパフォーマンスを高めると同時に、大量の計 … 続きを読む
Learning to Manipulate Anywhere: A Visual Generalizable Framework For Reinforcement Learning
要約 視覚運動ロボットに、オープンワールドの多様なシナリオで動作する汎用化機能を … 続きを読む
Detecting Brittle Decisions for Free: Leveraging Margin Consistency in Deep Robust Classifiers
要約 堅牢性を向上させるための敵対的トレーニング戦略に関する広範な研究にもかかわ … 続きを読む
Towards Latent Masked Image Modeling for Self-Supervised Visual Representation Learning
要約 マスク イメージ モデリング (MIM) は、画像のマスクされた部分から欠 … 続きを読む
HandDGP: Camera-Space Hand Mesh Prediction with Differentiable Global Positioning
要約 単一の RGB 画像からカメラ空間のハンド メッシュを予測することは、3D … 続きを読む
CarFormer: Self-Driving with Learned Object-Centric Representations
要約 自動運転では表現の選択が重要な役割を果たします。 近年、Bird̵ … 続きを読む
Reconstructing Training Data From Real World Models Trained with Transfer Learning
要約 トレーニングされた分類器からトレーニング データを再構成する現在の方法は、 … 続きを読む
RoboGolf: Mastering Real-World Minigolf with a Reflective Multi-Modality Vision-Language Model
要約 ミニゴルフは、身体化された知性を調べるための模範的な現実世界のゲームであり … 続きを読む