-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
xGen-MM-Vid (BLIP-3-Video): You Only Need 32 Tokens to Represent a Video Even in VLMs
要約 我々は、xGen-MM-Vid (BLIP-3-Video) を紹介します … 続きを読む
SAM2Long: Enhancing SAM 2 for Long Video Segmentation with a Training-Free Memory Tree
要約 Segment Anything Model 2 (SAM 2) は、画像 … 続きを読む
カテゴリー: cs.CV
SAM2Long: Enhancing SAM 2 for Long Video Segmentation with a Training-Free Memory Tree はコメントを受け付けていません
MvDrag3D: Drag-based Creative 3D Editing via Multi-view Generation-Reconstruction Priors
要約 ドラッグベースの編集は、画像生成モデルの機能によって 2D コンテンツ作成 … 続きを読む
カテゴリー: cs.CV
MvDrag3D: Drag-based Creative 3D Editing via Multi-view Generation-Reconstruction Priors はコメントを受け付けていません
FrugalNeRF: Fast Convergence for Few-shot Novel View Synthesis without Learned Priors
要約 Neural Radiance Fields (NeRF) は、主に高忠実 … 続きを読む
カテゴリー: cs.CV
FrugalNeRF: Fast Convergence for Few-shot Novel View Synthesis without Learned Priors はコメントを受け付けていません
Toward Generalizing Visual Brain Decoding to Unseen Subjects
要約 視覚脳デコーディングは、人間の脳活動から視覚情報を解読することを目的として … 続きを読む
Self Supervised Deep Learning for Robot Grasping
要約 学習ベースのロボット把握には現在、ラベル付きデータの使用が含まれています。 … 続きを読む
Optimal DLT-based Solutions for the Perspective-n-Point
要約 我々は、従来の DLT よりもはるかに優れた動作で透視 n 点 (PnP) … 続きを読む
PAPL-SLAM: Principal Axis-Anchored Monocular Point-Line SLAM
要約 ポイントライン SLAM システムでは、ライン構造情報の利用とラインの最適 … 続きを読む
Learning autonomous driving from aerial imagery
要約 この研究では、航空画像のみから地上車両の制御のためのエンドツーエンドの知覚 … 続きを読む
Takin-ADA: Emotion Controllable Audio-Driven Animation with Canonical and Landmark Loss Optimization
要約 既存のオーディオ駆動型の顔アニメーション手法は、表情漏れ、非効果的な微妙な … 続きを読む
カテゴリー: cs.CV
Takin-ADA: Emotion Controllable Audio-Driven Animation with Canonical and Landmark Loss Optimization はコメントを受け付けていません