月別アーカイブ: 2024年9月

SegTalker: Segmentation-based Talking Face Generation with Mask-guided Local Editing

要約 オーディオ駆動の話し顔生成は、入力オーディオに同期した唇の動きを伴うビデオ … 続きを読む

カテゴリー: cs.CV, cs.MM | SegTalker: Segmentation-based Talking Face Generation with Mask-guided Local Editing はコメントを受け付けていません

UniMERNet: A Universal Network for Real-World Mathematical Expression Recognition

要約 この論文では UniMER データセットを紹介し、複雑な現実世界のシナリオ … 続きを読む

カテゴリー: cs.CV | UniMERNet: A Universal Network for Real-World Mathematical Expression Recognition はコメントを受け付けていません

Surface-Centric Modeling for High-Fidelity Generalizable Neural Surface Reconstruction

要約 マルチビュー画像、特にまばらな画像から高忠実度の表面を再構成することは、近 … 続きを読む

カテゴリー: cs.CV | Surface-Centric Modeling for High-Fidelity Generalizable Neural Surface Reconstruction はコメントを受け付けていません

Mesh2NeRF: Direct Mesh Supervision for Neural Radiance Field Representation and Generation

要約 3D 生成タスクのためにテクスチャ メッシュからグラウンド トゥルース放射 … 続きを読む

カテゴリー: cs.CV | Mesh2NeRF: Direct Mesh Supervision for Neural Radiance Field Representation and Generation はコメントを受け付けていません

CDM: A Reliable Metric for Fair and Accurate Formula Recognition Evaluation

要約 数式の認識は、複雑な構造とさまざまな数式表記により、大きな課題を抱えていま … 続きを読む

カテゴリー: cs.CL, cs.CV | CDM: A Reliable Metric for Fair and Accurate Formula Recognition Evaluation はコメントを受け付けていません

RealisHuman: A Two-Stage Approach for Refining Malformed Human Parts in Generated Images

要約 近年、拡散モデルはビジュアル生成に革命をもたらし、敵対的生成ネットワーク … 続きを読む

カテゴリー: cs.CV | RealisHuman: A Two-Stage Approach for Refining Malformed Human Parts in Generated Images はコメントを受け付けていません

Segment Beyond View: Handling Partially Missing Modality for Audio-Visual Semantic Segmentation

要約 拡張現実 (AR) デバイスは、著名なモバイル インタラクション プラット … 続きを読む

カテゴリー: cs.CV, cs.SD, eess.AS | Segment Beyond View: Handling Partially Missing Modality for Audio-Visual Semantic Segmentation はコメントを受け付けていません

View-Invariant Policy Learning via Zero-Shot Novel View Synthesis

要約 大規模な視覚運動ポリシー学習は、一般化可能な操作システムの開発に向けた有望 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | View-Invariant Policy Learning via Zero-Shot Novel View Synthesis はコメントを受け付けていません

Geometry Image Diffusion: Fast and Data-Efficient Text-to-3D with Image-Based Surface Representation

要約 テキストの説明から高品質の 3D オブジェクトを生成することは、計算コスト … 続きを読む

カテゴリー: cs.CV, cs.GR | Geometry Image Diffusion: Fast and Data-Efficient Text-to-3D with Image-Based Surface Representation はコメントを受け付けていません

ArtiFade: Learning to Generate High-quality Subject from Blemished Images

要約 被写体主導のテキストから画像への生成では、限られた数の画像のみを使用して被 … 続きを読む

カテゴリー: cs.CV | ArtiFade: Learning to Generate High-quality Subject from Blemished Images はコメントを受け付けていません