-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
GrowSplat: Constructing Temporal Digital Twins of Plants with Gaussian Splats
要約 植物の成長の正確な時間的再構成は、植物の表現型と繁殖には不可欠ですが、植物 … 続きを読む
M3Bench: Benchmarking Whole-body Motion Generation for Mobile Manipulation in 3D Scenes
要約 モバイル操作タスクにおける全身モーション生成のための新しいベンチマークであ … 続きを読む
TrackVLA: Embodied Visual Tracking in the Wild
要約 具体化された視覚追跡は、具体化されたAIの基本的なスキルであり、エージェン … 続きを読む
Information Entropy Guided Height-aware Histogram for Quantization-friendly Pillar Feature Encoder
要約 リアルタイムおよび高性能3Dオブジェクト検出は、自律運転とロボット工学にお … 続きを読む
FlexEvent: Towards Flexible Event-Frame Object Detection at Varying Operational Frequencies
要約 イベントカメラは、マイクロ秒レベルの時間分解能と非同期操作のおかげで、動的 … 続きを読む
SeeGround: See and Ground for Zero-Shot Open-Vocabulary 3D Visual Grounding
要約 3D Visual Grounding(3DVG)は、拡張現実やロボット工 … 続きを読む
Jigsaw-R1: A Study of Rule-based Visual Reinforcement Learning with Jigsaw Puzzles
要約 ルールベースの強化学習(RL)をマルチモーダル大手言語モデル(MLLMS) … 続きを読む
Autoregressive Meta-Actions for Unified Controllable Trajectory Generation
要約 メタアクションと呼ばれる高レベルのセマンティック決定に導かれた制御可能な軌 … 続きを読む
One Trajectory, One Token: Grounded Video Tokenization via Panoptic Sub-object Trajectory
要約 効果的なビデオトークン化は、長いビデオのトランスモデルをスケーリングするた … 続きを読む
ZeroSep: Separate Anything in Audio with Zero Training
要約 オーディオソースの分離は、マシンが複雑な音響環境を理解し、多数のオーディオ … 続きを読む