月別アーカイブ: 2023年8月

SkipcrossNets: Adaptive Skip-cross Fusion for Road Detection

投稿日: 2023年8月25日作成者: jarxiv

要約さまざまなモダリティからの画像が特徴抽出のための独自の情報を提供するため、 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

ToonTalker: Cross-Domain Face Reenactment

投稿日: 2023年8月25日作成者: jarxiv

要約この論文では、クロスドメインの顔の再現、つまり、漫画の画像と実際の人物のビ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

MIPS-Fusion: Multi-Implicit-Submaps for Scalable and Robust Online Neural RGB-D Reconstruction

投稿日: 2023年8月25日作成者: jarxiv

要約新しいニューラル暗黙的表現であるマルチ暗黙的サブマップに基づいた、堅牢でス … 続きを読む →

カテゴリー: cs.CV, cs.GR | コメントを受け付けていません

VNI-Net: Vector Neurons-based Rotation-Invariant Descriptor for LiDAR Place Recognition

投稿日: 2023年8月25日作成者: jarxiv

要約 LiDAR ベースの場所認識は、同時位置特定とマッピング (SLAM) お … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Multi-stage feature decorrelation constraints for improving CNN classification performance

投稿日: 2023年8月25日作成者: jarxiv

要約パターン分類に使用される畳み込みニューラルネットワーク (CNN) の場 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Boosting Semantic Segmentation from the Perspective of Explicit Class Embeddings

投稿日: 2023年8月25日作成者: jarxiv

要約セマンティックセグメンテーションは、ラベルを画像内の各ピクセルに関連付け … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Beyond Document Page Classification: Design, Datasets, and Challenges

投稿日: 2023年8月25日作成者: jarxiv

要約このペーパーでは、テストされるデータの性質 ($X$: マルチチャネル、マ … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Multimodal Image Synthesis and Editing: The Generative AI Era

投稿日: 2023年8月25日作成者: jarxiv

要約実世界では情報がさまざまなモダリティで存在するため、マルチモーダル情報間の … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Can Linguistic Knowledge Improve Multimodal Alignment in Vision-Language Pretraining?

投稿日: 2023年8月25日作成者: jarxiv

要約マルチメディアコミュニティは、マルチモーダルな事前学習済みニューラルネ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | コメントを受け付けていません

Zolly: Zoom Focal Length Correctly for Perspective-Distorted Human Mesh Reconstruction

投稿日: 2023年8月25日作成者: jarxiv

要約単一ビューの RGB 画像を実際にキャリブレーションするのは難しいため、既 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

月別アーカイブ: 2023年8月

SkipcrossNets: Adaptive Skip-cross Fusion for Road Detection

ToonTalker: Cross-Domain Face Reenactment

MIPS-Fusion: Multi-Implicit-Submaps for Scalable and Robust Online Neural RGB-D Reconstruction

VNI-Net: Vector Neurons-based Rotation-Invariant Descriptor for LiDAR Place Recognition

Multi-stage feature decorrelation constraints for improving CNN classification performance

Boosting Semantic Segmentation from the Perspective of Explicit Class Embeddings

Beyond Document Page Classification: Design, Datasets, and Challenges

Multimodal Image Synthesis and Editing: The Generative AI Era

Can Linguistic Knowledge Improve Multimodal Alignment in Vision-Language Pretraining?

Zolly: Zoom Focal Length Correctly for Perspective-Distorted Human Mesh Reconstruction

最近の投稿

最近のコメント

アーカイブ

カテゴリー