月別アーカイブ: 2023年8月

SkipcrossNets: Adaptive Skip-cross Fusion for Road Detection

要約 さまざまなモダリティからの画像が特徴抽出のための独自の情報を提供するため、 … 続きを読む

カテゴリー: cs.CV | SkipcrossNets: Adaptive Skip-cross Fusion for Road Detection はコメントを受け付けていません

ToonTalker: Cross-Domain Face Reenactment

要約 この論文では、クロスドメインの顔の再現、つまり、漫画の画像と実際の人物のビ … 続きを読む

カテゴリー: cs.CV | ToonTalker: Cross-Domain Face Reenactment はコメントを受け付けていません

MIPS-Fusion: Multi-Implicit-Submaps for Scalable and Robust Online Neural RGB-D Reconstruction

要約 新しいニューラル暗黙的表現であるマルチ暗黙的サブマップに基づいた、堅牢でス … 続きを読む

カテゴリー: cs.CV, cs.GR | MIPS-Fusion: Multi-Implicit-Submaps for Scalable and Robust Online Neural RGB-D Reconstruction はコメントを受け付けていません

VNI-Net: Vector Neurons-based Rotation-Invariant Descriptor for LiDAR Place Recognition

要約 LiDAR ベースの場所認識は、同時位置特定とマッピング (SLAM) お … 続きを読む

カテゴリー: cs.CV | VNI-Net: Vector Neurons-based Rotation-Invariant Descriptor for LiDAR Place Recognition はコメントを受け付けていません

Multi-stage feature decorrelation constraints for improving CNN classification performance

要約 パターン分類に使用される畳み込みニューラル ネットワーク (CNN) の場 … 続きを読む

カテゴリー: cs.CV | Multi-stage feature decorrelation constraints for improving CNN classification performance はコメントを受け付けていません

Boosting Semantic Segmentation from the Perspective of Explicit Class Embeddings

要約 セマンティック セグメンテーションは、ラベルを画像内の各ピクセルに関連付け … 続きを読む

カテゴリー: cs.CV | Boosting Semantic Segmentation from the Perspective of Explicit Class Embeddings はコメントを受け付けていません

Beyond Document Page Classification: Design, Datasets, and Challenges

要約 このペーパーでは、テストされるデータの性質 ($X$: マルチチャネル、マ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | Beyond Document Page Classification: Design, Datasets, and Challenges はコメントを受け付けていません

Multimodal Image Synthesis and Editing: The Generative AI Era

要約 実世界では情報がさまざまなモダリティで存在するため、マルチモーダル情報間の … 続きを読む

カテゴリー: cs.CV | Multimodal Image Synthesis and Editing: The Generative AI Era はコメントを受け付けていません

Can Linguistic Knowledge Improve Multimodal Alignment in Vision-Language Pretraining?

要約 マルチメディア コミュニティは、マルチモーダルな事前学習済みニューラル ネ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | Can Linguistic Knowledge Improve Multimodal Alignment in Vision-Language Pretraining? はコメントを受け付けていません

Zolly: Zoom Focal Length Correctly for Perspective-Distorted Human Mesh Reconstruction

要約 単一ビューの RGB 画像を実際にキャリブレーションするのは難しいため、既 … 続きを読む

カテゴリー: cs.CV | Zolly: Zoom Focal Length Correctly for Perspective-Distorted Human Mesh Reconstruction はコメントを受け付けていません