cs.CV」カテゴリーアーカイブ

GrowSplat: Constructing Temporal Digital Twins of Plants with Gaussian Splats

要約 植物の成長の正確な時間的再構成は、植物の表現型と繁殖には不可欠ですが、植物 … 続きを読む

カテゴリー: cs.CV, cs.RO | GrowSplat: Constructing Temporal Digital Twins of Plants with Gaussian Splats はコメントを受け付けていません

M3Bench: Benchmarking Whole-body Motion Generation for Mobile Manipulation in 3D Scenes

要約 モバイル操作タスクにおける全身モーション生成のための新しいベンチマークであ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | M3Bench: Benchmarking Whole-body Motion Generation for Mobile Manipulation in 3D Scenes はコメントを受け付けていません

TrackVLA: Embodied Visual Tracking in the Wild

要約 具体化された視覚追跡は、具体化されたAIの基本的なスキルであり、エージェン … 続きを読む

カテゴリー: cs.CV, cs.RO | TrackVLA: Embodied Visual Tracking in the Wild はコメントを受け付けていません

Information Entropy Guided Height-aware Histogram for Quantization-friendly Pillar Feature Encoder

要約 リアルタイムおよび高性能3Dオブジェクト検出は、自律運転とロボット工学にお … 続きを読む

カテゴリー: cs.CV, cs.RO | Information Entropy Guided Height-aware Histogram for Quantization-friendly Pillar Feature Encoder はコメントを受け付けていません

FlexEvent: Towards Flexible Event-Frame Object Detection at Varying Operational Frequencies

要約 イベントカメラは、マイクロ秒レベルの時間分解能と非同期操作のおかげで、動的 … 続きを読む

カテゴリー: cs.CV, cs.RO | FlexEvent: Towards Flexible Event-Frame Object Detection at Varying Operational Frequencies はコメントを受け付けていません

SeeGround: See and Ground for Zero-Shot Open-Vocabulary 3D Visual Grounding

要約 3D Visual Grounding(3DVG)は、拡張現実やロボット工 … 続きを読む

カテゴリー: cs.CV, cs.RO | SeeGround: See and Ground for Zero-Shot Open-Vocabulary 3D Visual Grounding はコメントを受け付けていません

Jigsaw-R1: A Study of Rule-based Visual Reinforcement Learning with Jigsaw Puzzles

要約 ルールベースの強化学習(RL)をマルチモーダル大手言語モデル(MLLMS) … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Jigsaw-R1: A Study of Rule-based Visual Reinforcement Learning with Jigsaw Puzzles はコメントを受け付けていません

Autoregressive Meta-Actions for Unified Controllable Trajectory Generation

要約 メタアクションと呼ばれる高レベルのセマンティック決定に導かれた制御可能な軌 … 続きを読む

カテゴリー: cs.CV, cs.RO | Autoregressive Meta-Actions for Unified Controllable Trajectory Generation はコメントを受け付けていません

One Trajectory, One Token: Grounded Video Tokenization via Panoptic Sub-object Trajectory

要約 効果的なビデオトークン化は、長いビデオのトランスモデルをスケーリングするた … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG | One Trajectory, One Token: Grounded Video Tokenization via Panoptic Sub-object Trajectory はコメントを受け付けていません

ZeroSep: Separate Anything in Audio with Zero Training

要約 オーディオソースの分離は、マシンが複雑な音響環境を理解し、多数のオーディオ … 続きを読む

カテゴリー: cs.CV, cs.SD | ZeroSep: Separate Anything in Audio with Zero Training はコメントを受け付けていません