-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年1月
Universal Online Temporal Calibration for Optimization-based Visual-Inertial Navigation Systems
要約 視覚センサーと慣性センサーの組み合わせによる6自由度(6DoF)運動推定は … 続きを読む
Ingredients: Blending Custom Photos with Video Diffusion Transformers
要約 本論文では、ビデオ拡散トランスフォーマー(ビデオ拡散トランスフォーマー)を … 続きを読む
カテゴリー: cs.CV
Ingredients: Blending Custom Photos with Video Diffusion Transformers はコメントを受け付けていません
A Minimal Subset Approach for Efficient and Scalable Loop Closure
要約 大規模かつ長期的なミッションにおけるループ閉鎖検出は、ポーズグラフ最適化の … 続きを読む
FGAseg: Fine-Grained Pixel-Text Alignment for Open-Vocabulary Semantic Segmentation
要約 オープンボキャブラリセグメンテーションは、テキストベースの記述に基づいて、 … 続きを読む
カテゴリー: cs.CV
FGAseg: Fine-Grained Pixel-Text Alignment for Open-Vocabulary Semantic Segmentation はコメントを受け付けていません
JoyGen: Audio-Driven 3D Depth-Aware Talking-Face Video Editing
要約 しかし、入力音声に基づく唇形状の編集において、正確な唇と音声の同期と高い視 … 続きを読む
カテゴリー: cs.CV
JoyGen: Audio-Driven 3D Depth-Aware Talking-Face Video Editing はコメントを受け付けていません
Balanced Residual Distillation Learning for 3D Point Cloud Class-Incremental Semantic Segmentation
要約 クラス増加学習(CIL)は、新しいクラスの継続的な学習を可能にする一方で、 … 続きを読む
カテゴリー: cs.CV
Balanced Residual Distillation Learning for 3D Point Cloud Class-Incremental Semantic Segmentation はコメントを受け付けていません
2.5 Years in Class: A Multimodal Textbook for Vision-Language Pretraining
要約 画像-テキストペアデータと比較して、インターリーブコーパスは、視覚言語モデ … 続きを読む
MoEE: Mixture of Emotion Experts for Audio-Driven Portrait Animation
要約 しゃべるアバターの世代は、正確な音声同期において大きな進歩を遂げました。し … 続きを読む
カテゴリー: cs.CV
MoEE: Mixture of Emotion Experts for Audio-Driven Portrait Animation はコメントを受け付けていません
Uncertainty-Aware Label Refinement on Hypergraphs for Personalized Federated Facial Expression Recognition
要約 表情認識(FER)モデルの多くは、大規模な表情データを用いた集中学習によっ … 続きを読む
カテゴリー: cs.CV
Uncertainty-Aware Label Refinement on Hypergraphs for Personalized Federated Facial Expression Recognition はコメントを受け付けていません
Bridging Simplicity and Sophistication using GLinear: A Novel Architecture for Enhanced Time Series Prediction
要約 時系列予測(TSF)は多くの分野で重要なアプリケーションである。Trans … 続きを読む