-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Cross-Attention Head Position Patterns Can Align with Human Visual Concepts in Text-to-Image Generative Models
要約 最近のテキスト間拡散モデルは、視覚的な生成タスクの範囲を強化するために効果 … 続きを読む
Tidiness Score-Guided Monte Carlo Tree Search for Visual Tabletop Rearrangement
要約 このホワイトペーパーでは、RGB-Dカメラのみを使用してテーブルトップの片 … 続きを読む
A novel approach to navigate the taxonomic hierarchy to address the Open-World Scenarios in Medicinal Plant Classification
要約 この記事では、問題をオープンクラスの問題として提起することにより、植物の階 … 続きを読む
AnyTop: Character Animation Diffusion with Any Topology
要約 任意のスケルトンの動きを生成することは、コンピューターグラフィックスの長年 … 続きを読む
DIS-CO: Discovering Copyrighted Content in VLMs Training Data
要約 トレーニングデータに直接アクセスすることなく、著作権で保護されたコンテンツ … 続きを読む
RELICT: A Replica Detection Framework for Medical Image Generation
要約 深い学習モデルの一般化を強化し、改善するための合成医療データの可能性にもか … 続きを読む
Experimental validation of UAV search and detection system in real wilderness environment
要約 Search and Rescue(SAR)ミッションには、特に挑戦的また … 続きを読む
MLLMs Know Where to Look: Training-free Perception of Small Visual Details with Multimodal LLMs
要約 マルチモーダル大手言語モデル(MLLM)は、近年、視覚認識タスクの急速な進 … 続きを読む
FACTR: Force-Attending Curriculum Training for Contact-Rich Policy Learning
要約 ボックスピックアップやローリング生地など、人間が実行する多くのコンタクトリ … 続きを読む
V-HOP: Visuo-Haptic 6D Object Pose Tracking
要約 人間は、操作中に堅牢なオブジェクト知覚のために視覚と触覚を自然に統合します … 続きを読む