-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Keypoint Detection and Description for Raw Bayer Images
要約 キーポイント検出とローカル機能の説明は、ロボット認識の基本的なタスクであり … 続きを読む
カテゴリー: cs.CV
Keypoint Detection and Description for Raw Bayer Images はコメントを受け付けていません
Language-Depth Navigated Thermal and Visible Image Fusion
要約 深さ誘導マルチモーダルフュージョンは、可視および赤外線画像から深さ情報を組 … 続きを読む
カテゴリー: cs.CV
Language-Depth Navigated Thermal and Visible Image Fusion はコメントを受け付けていません
OmniPaint: Mastering Object-Oriented Editing via Disentangled Insertion-Removal Inpainting
要約 拡散ベースの生成モデルは、オブジェクト指向の画像編集に革命をもたらしました … 続きを読む
カテゴリー: cs.CV
OmniPaint: Mastering Object-Oriented Editing via Disentangled Insertion-Removal Inpainting はコメントを受け付けていません
GarmentCrafter: Progressive Novel View Synthesis for Single-View 3D Garment Reconstruction and Editing
要約 GarmentCrafterを紹介します。これは、非専門的なユーザーがシン … 続きを読む
CoLMDriver: LLM-based Negotiation Benefits Cooperative Autonomous Driving
要約 車両から車両への(V2V)協同的自律運転は、単一エージェントシステムに固有 … 続きを読む
‘Principal Components’ Enable A New Language of Images
要約 潜在的なトークン空間に証明可能なPCA様構造を埋め込む新しい視覚トークン化 … 続きを読む
カテゴリー: cs.CV
‘Principal Components’ Enable A New Language of Images はコメントを受け付けていません
OmniMamba: Efficient and Unified Multimodal Understanding and Generation via State Space Models
要約 統一されたマルチモーダル理解と視覚生成(またはマルチモーダル生成)モデルの … 続きを読む
カテゴリー: cs.CV
OmniMamba: Efficient and Unified Multimodal Understanding and Generation via State Space Models はコメントを受け付けていません
QuoTA: Query-oriented Token Assignment via CoT Query Decouple for Long Video Comprehension
要約 長いビデオ理解における最近の進歩は、通常、注意分布に基づいて視覚トークン剪 … 続きを読む
カテゴリー: cs.CV
QuoTA: Query-oriented Token Assignment via CoT Query Decouple for Long Video Comprehension はコメントを受け付けていません
AthletePose3D: A Benchmark Dataset for 3D Human Pose Estimation and Kinematic Validation in Athletic Movements
要約 人間のポーズ推定は、スポーツ科学、リハビリテーション、および生体力学的研究 … 続きを読む
カテゴリー: cs.CV
AthletePose3D: A Benchmark Dataset for 3D Human Pose Estimation and Kinematic Validation in Athletic Movements はコメントを受け付けていません
DaD: Distilled Reinforcement Learning for Diverse Keypoint Detection
要約 キーポイントは、構造からの構造(SFM)システムが数千の画像にスケーリング … 続きを読む
カテゴリー: cs.CV
DaD: Distilled Reinforcement Learning for Diverse Keypoint Detection はコメントを受け付けていません