月別アーカイブ: 2025年1月

Universal Online Temporal Calibration for Optimization-based Visual-Inertial Navigation Systems

要約 視覚センサーと慣性センサーの組み合わせによる6自由度(6DoF)運動推定は … 続きを読む

カテゴリー: cs.CV, cs.RO | Universal Online Temporal Calibration for Optimization-based Visual-Inertial Navigation Systems はコメントを受け付けていません

Ingredients: Blending Custom Photos with Video Diffusion Transformers

要約 本論文では、ビデオ拡散トランスフォーマー(ビデオ拡散トランスフォーマー)を … 続きを読む

カテゴリー: cs.CV | Ingredients: Blending Custom Photos with Video Diffusion Transformers はコメントを受け付けていません

A Minimal Subset Approach for Efficient and Scalable Loop Closure

要約 大規模かつ長期的なミッションにおけるループ閉鎖検出は、ポーズグラフ最適化の … 続きを読む

カテゴリー: cs.CV, cs.RO | A Minimal Subset Approach for Efficient and Scalable Loop Closure はコメントを受け付けていません

FGAseg: Fine-Grained Pixel-Text Alignment for Open-Vocabulary Semantic Segmentation

要約 オープンボキャブラリセグメンテーションは、テキストベースの記述に基づいて、 … 続きを読む

カテゴリー: cs.CV | FGAseg: Fine-Grained Pixel-Text Alignment for Open-Vocabulary Semantic Segmentation はコメントを受け付けていません

JoyGen: Audio-Driven 3D Depth-Aware Talking-Face Video Editing

要約 しかし、入力音声に基づく唇形状の編集において、正確な唇と音声の同期と高い視 … 続きを読む

カテゴリー: cs.CV | JoyGen: Audio-Driven 3D Depth-Aware Talking-Face Video Editing はコメントを受け付けていません

Balanced Residual Distillation Learning for 3D Point Cloud Class-Incremental Semantic Segmentation

要約 クラス増加学習(CIL)は、新しいクラスの継続的な学習を可能にする一方で、 … 続きを読む

カテゴリー: cs.CV | Balanced Residual Distillation Learning for 3D Point Cloud Class-Incremental Semantic Segmentation はコメントを受け付けていません

2.5 Years in Class: A Multimodal Textbook for Vision-Language Pretraining

要約 画像-テキストペアデータと比較して、インターリーブコーパスは、視覚言語モデ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | 2.5 Years in Class: A Multimodal Textbook for Vision-Language Pretraining はコメントを受け付けていません

MoEE: Mixture of Emotion Experts for Audio-Driven Portrait Animation

要約 しゃべるアバターの世代は、正確な音声同期において大きな進歩を遂げました。し … 続きを読む

カテゴリー: cs.CV | MoEE: Mixture of Emotion Experts for Audio-Driven Portrait Animation はコメントを受け付けていません

Uncertainty-Aware Label Refinement on Hypergraphs for Personalized Federated Facial Expression Recognition

要約 表情認識(FER)モデルの多くは、大規模な表情データを用いた集中学習によっ … 続きを読む

カテゴリー: cs.CV | Uncertainty-Aware Label Refinement on Hypergraphs for Personalized Federated Facial Expression Recognition はコメントを受け付けていません

Bridging Simplicity and Sophistication using GLinear: A Novel Architecture for Enhanced Time Series Prediction

要約 時系列予測(TSF)は多くの分野で重要なアプリケーションである。Trans … 続きを読む

カテゴリー: cs.CV, cs.ET, cs.LG | Bridging Simplicity and Sophistication using GLinear: A Novel Architecture for Enhanced Time Series Prediction はコメントを受け付けていません