月別アーカイブ: 2024年9月

SegTalker: Segmentation-based Talking Face Generation with Mask-guided Local Editing

投稿日: 2024年9月6日作成者: jarxiv

要約オーディオ駆動の話し顔生成は、入力オーディオに同期した唇の動きを伴うビデオ … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

UniMERNet: A Universal Network for Real-World Mathematical Expression Recognition

投稿日: 2024年9月6日作成者: jarxiv

要約この論文では UniMER データセットを紹介し、複雑な現実世界のシナリオ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Surface-Centric Modeling for High-Fidelity Generalizable Neural Surface Reconstruction

投稿日: 2024年9月6日作成者: jarxiv

要約マルチビュー画像、特にまばらな画像から高忠実度の表面を再構成することは、近 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Mesh2NeRF: Direct Mesh Supervision for Neural Radiance Field Representation and Generation

投稿日: 2024年9月6日作成者: jarxiv

要約 3D 生成タスクのためにテクスチャメッシュからグラウンドトゥルース放射 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

CDM: A Reliable Metric for Fair and Accurate Formula Recognition Evaluation

投稿日: 2024年9月6日作成者: jarxiv

要約数式の認識は、複雑な構造とさまざまな数式表記により、大きな課題を抱えていま … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

RealisHuman: A Two-Stage Approach for Refining Malformed Human Parts in Generated Images

投稿日: 2024年9月6日作成者: jarxiv

要約近年、拡散モデルはビジュアル生成に革命をもたらし、敵対的生成ネットワーク … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Segment Beyond View: Handling Partially Missing Modality for Audio-Visual Semantic Segmentation

投稿日: 2024年9月6日作成者: jarxiv

要約拡張現実 (AR) デバイスは、著名なモバイルインタラクションプラット … 続きを読む →

カテゴリー: cs.CV, cs.SD, eess.AS | コメントを受け付けていません

View-Invariant Policy Learning via Zero-Shot Novel View Synthesis

投稿日: 2024年9月6日作成者: jarxiv

要約大規模な視覚運動ポリシー学習は、一般化可能な操作システムの開発に向けた有望 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Geometry Image Diffusion: Fast and Data-Efficient Text-to-3D with Image-Based Surface Representation

投稿日: 2024年9月6日作成者: jarxiv

要約テキストの説明から高品質の 3D オブジェクトを生成することは、計算コスト … 続きを読む →

カテゴリー: cs.CV, cs.GR | コメントを受け付けていません

ArtiFade: Learning to Generate High-quality Subject from Blemished Images

投稿日: 2024年9月6日作成者: jarxiv

要約被写体主導のテキストから画像への生成では、限られた数の画像のみを使用して被 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

月別アーカイブ: 2024年9月

SegTalker: Segmentation-based Talking Face Generation with Mask-guided Local Editing

UniMERNet: A Universal Network for Real-World Mathematical Expression Recognition

Surface-Centric Modeling for High-Fidelity Generalizable Neural Surface Reconstruction

Mesh2NeRF: Direct Mesh Supervision for Neural Radiance Field Representation and Generation

CDM: A Reliable Metric for Fair and Accurate Formula Recognition Evaluation

RealisHuman: A Two-Stage Approach for Refining Malformed Human Parts in Generated Images

Segment Beyond View: Handling Partially Missing Modality for Audio-Visual Semantic Segmentation

View-Invariant Policy Learning via Zero-Shot Novel View Synthesis

Geometry Image Diffusion: Fast and Data-Efficient Text-to-3D with Image-Based Surface Representation

ArtiFade: Learning to Generate High-quality Subject from Blemished Images

最近の投稿

最近のコメント

アーカイブ

カテゴリー