-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
Attribution Analysis Meets Model Editing: Advancing Knowledge Correction in Vision Language Models with VisEdit
要約 モデル編集は、大規模なモデルにおいて、コストのかかる再トレーニングを行うこ … 続きを読む
Leveraging Consistent Spatio-Temporal Correspondence for Robust Visual Odometry
要約 VOに対する最近のアプローチは、ビデオフレーム間のオプティカルフローを予測 … 続きを読む
カテゴリー: cs.CV
Leveraging Consistent Spatio-Temporal Correspondence for Robust Visual Odometry はコメントを受け付けていません
Universal Online Temporal Calibration for Optimization-based Visual-Inertial Navigation Systems
要約 視覚センサーと慣性センサーの組み合わせによる6自由度(6DoF)運動推定は … 続きを読む
Ingredients: Blending Custom Photos with Video Diffusion Transformers
要約 本論文では、ビデオ拡散トランスフォーマー(ビデオ拡散トランスフォーマー)を … 続きを読む
カテゴリー: cs.CV
Ingredients: Blending Custom Photos with Video Diffusion Transformers はコメントを受け付けていません
A Minimal Subset Approach for Efficient and Scalable Loop Closure
要約 大規模かつ長期的なミッションにおけるループ閉鎖検出は、ポーズグラフ最適化の … 続きを読む
FGAseg: Fine-Grained Pixel-Text Alignment for Open-Vocabulary Semantic Segmentation
要約 オープンボキャブラリセグメンテーションは、テキストベースの記述に基づいて、 … 続きを読む
カテゴリー: cs.CV
FGAseg: Fine-Grained Pixel-Text Alignment for Open-Vocabulary Semantic Segmentation はコメントを受け付けていません
JoyGen: Audio-Driven 3D Depth-Aware Talking-Face Video Editing
要約 しかし、入力音声に基づく唇形状の編集において、正確な唇と音声の同期と高い視 … 続きを読む
カテゴリー: cs.CV
JoyGen: Audio-Driven 3D Depth-Aware Talking-Face Video Editing はコメントを受け付けていません
Balanced Residual Distillation Learning for 3D Point Cloud Class-Incremental Semantic Segmentation
要約 クラス増加学習(CIL)は、新しいクラスの継続的な学習を可能にする一方で、 … 続きを読む
カテゴリー: cs.CV
Balanced Residual Distillation Learning for 3D Point Cloud Class-Incremental Semantic Segmentation はコメントを受け付けていません
2.5 Years in Class: A Multimodal Textbook for Vision-Language Pretraining
要約 画像-テキストペアデータと比較して、インターリーブコーパスは、視覚言語モデ … 続きを読む
MoEE: Mixture of Emotion Experts for Audio-Driven Portrait Animation
要約 しゃべるアバターの世代は、正確な音声同期において大きな進歩を遂げました。し … 続きを読む
カテゴリー: cs.CV
MoEE: Mixture of Emotion Experts for Audio-Driven Portrait Animation はコメントを受け付けていません