月別アーカイブ: 2023年9月

YCB-Ev: Event-vision dataset for 6DoF object pose estimation

要約 私たちの研究では、これらのモダリティを使用して 6DoF オブジェクトの姿 … 続きを読む

カテゴリー: cs.CV | YCB-Ev: Event-vision dataset for 6DoF object pose estimation はコメントを受け付けていません

OccupancyDETR: Making Semantic Scene Completion as Straightforward as Object Detection

要約 視覚ベースの 3D セマンティック占有知覚 (3D セマンティック シーン … 続きを読む

カテゴリー: cs.CV, cs.RO | OccupancyDETR: Making Semantic Scene Completion as Straightforward as Object Detection はコメントを受け付けていません

Self-Correlation and Cross-Correlation Learning for Few-Shot Remote Sensing Image Semantic Segmentation

要約 リモートセンシング画像の意味セグメンテーションは、リモートセンシング画像の … 続きを読む

カテゴリー: cs.CV | Self-Correlation and Cross-Correlation Learning for Few-Shot Remote Sensing Image Semantic Segmentation はコメントを受け付けていません

Generalised Probabilistic Diffusion Scale-Spaces

要約 確率的拡散モデルは、学習された分布から新しい画像をサンプリングすることに優 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Generalised Probabilistic Diffusion Scale-Spaces はコメントを受け付けていません

SCT: A Simple Baseline for Parameter-Efficient Fine-Tuning via Salient Channels

要約 事前トレーニングされたビジョン トランスフォーマーは、さまざまな下流タスク … 続きを読む

カテゴリー: cs.AI, cs.CV | SCT: A Simple Baseline for Parameter-Efficient Fine-Tuning via Salient Channels はコメントを受け付けていません

Breathing New Life into 3D Assets with Generative Repainting

要約 拡散ベースのテキストから画像へのモデルは、ビジョン コミュニティ、アーティ … 続きを読む

カテゴリー: cs.CV, cs.GR | Breathing New Life into 3D Assets with Generative Repainting はコメントを受け付けていません

MixStyle Neural Networks for Domain Generalization and Adaptation

要約 ニューラル ネットワークは、ドメイン シフトのある目に見えないデータをうま … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | MixStyle Neural Networks for Domain Generalization and Adaptation はコメントを受け付けていません

Towards Practical and Efficient Image-to-Speech Captioning with Vision-Language Pre-training and Multi-modal Tokens

要約 この論文では、強力かつ効率的な Image-to-Speech キャプショ … 続きを読む

カテゴリー: cs.CL, cs.CV, eess.AS, eess.IV | Towards Practical and Efficient Image-to-Speech Captioning with Vision-Language Pre-training and Multi-modal Tokens はコメントを受け付けていません

Automated dermatoscopic pattern discovery by clustering neural network output for human-computer interaction

要約 背景: 利用可能な医療画像データセットのサイズが増大するにつれて、臨床医が … 続きを読む

カテゴリー: cs.CV, cs.HC, H.5.2 | Automated dermatoscopic pattern discovery by clustering neural network output for human-computer interaction はコメントを受け付けていません

Visual Speech Recognition for Low-resource Languages with Automatic Labels From Whisper Model

要約 この論文では、複数の言語、特にラベル付きデータの数が限られている低リソース … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.AS | Visual Speech Recognition for Low-resource Languages with Automatic Labels From Whisper Model はコメントを受け付けていません