-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年3月
REGEN: Learning Compact Video Embedding with (Re-)Generative Decoder
要約 生成モデリングのためのビデオ埋め込み装置の学習に関する新しい視点を提示しま … 続きを読む
SSVQ: Unleashing the Potential of Vector Quantization with Sign-Splitting
要約 ベクター量子化(VQ)は、特に極端な圧縮シナリオでは、多様なモデル全体で均 … 続きを読む
カテゴリー: cs.CV
SSVQ: Unleashing the Potential of Vector Quantization with Sign-Splitting はコメントを受け付けていません
Keypoint Detection and Description for Raw Bayer Images
要約 キーポイント検出とローカル機能の説明は、ロボット認識の基本的なタスクであり … 続きを読む
カテゴリー: cs.CV
Keypoint Detection and Description for Raw Bayer Images はコメントを受け付けていません
Language-Depth Navigated Thermal and Visible Image Fusion
要約 深さ誘導マルチモーダルフュージョンは、可視および赤外線画像から深さ情報を組 … 続きを読む
カテゴリー: cs.CV
Language-Depth Navigated Thermal and Visible Image Fusion はコメントを受け付けていません
OmniPaint: Mastering Object-Oriented Editing via Disentangled Insertion-Removal Inpainting
要約 拡散ベースの生成モデルは、オブジェクト指向の画像編集に革命をもたらしました … 続きを読む
カテゴリー: cs.CV
OmniPaint: Mastering Object-Oriented Editing via Disentangled Insertion-Removal Inpainting はコメントを受け付けていません
GarmentCrafter: Progressive Novel View Synthesis for Single-View 3D Garment Reconstruction and Editing
要約 GarmentCrafterを紹介します。これは、非専門的なユーザーがシン … 続きを読む
CoLMDriver: LLM-based Negotiation Benefits Cooperative Autonomous Driving
要約 車両から車両への(V2V)協同的自律運転は、単一エージェントシステムに固有 … 続きを読む
‘Principal Components’ Enable A New Language of Images
要約 潜在的なトークン空間に証明可能なPCA様構造を埋め込む新しい視覚トークン化 … 続きを読む
カテゴリー: cs.CV
‘Principal Components’ Enable A New Language of Images はコメントを受け付けていません
OmniMamba: Efficient and Unified Multimodal Understanding and Generation via State Space Models
要約 統一されたマルチモーダル理解と視覚生成(またはマルチモーダル生成)モデルの … 続きを読む
カテゴリー: cs.CV
OmniMamba: Efficient and Unified Multimodal Understanding and Generation via State Space Models はコメントを受け付けていません
QuoTA: Query-oriented Token Assignment via CoT Query Decouple for Long Video Comprehension
要約 長いビデオ理解における最近の進歩は、通常、注意分布に基づいて視覚トークン剪 … 続きを読む
カテゴリー: cs.CV
QuoTA: Query-oriented Token Assignment via CoT Query Decouple for Long Video Comprehension はコメントを受け付けていません