月別アーカイブ: 2023年7月

Towards Open Vocabulary Learning: A Survey

投稿日: 2023年7月7日作成者: jarxiv

要約視覚的なシーンの理解の分野では、ディープニューラルネットワークは、セグ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Adaptive Sparse ViT: Towards Learnable Adaptive Token Pruning by Fully Exploiting Self-Attention

投稿日: 2023年7月7日作成者: jarxiv

要約ビジョントランスフォーマーは、コンピュータービジョンの新しいパラダイム … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

KITE: Keypoint-Conditioned Policies for Semantic Manipulation

投稿日: 2023年7月7日作成者: jarxiv

要約自然言語は人間とロボットに便利な共有インターフェイスを提供しますが、ロボッ … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Image Matters: A New Dataset and Empirical Study for Multimodal Hyperbole Detection

投稿日: 2023年7月7日作成者: jarxiv

要約誇張、または誇張は一般的な言語現象です。誇張の検出は人間の表現を理解する … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

DisAsymNet: Disentanglement of Asymmetrical Abnormality on Bilateral Mammograms using Self-adversarial Learning

投稿日: 2023年7月7日作成者: jarxiv

要約非対称性は、異常が発生している場合の両側マンモグラム (Bi-MG) の重 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

DiffusionDB: A Large-scale Prompt Gallery Dataset for Text-to-Image Generative Models

投稿日: 2023年7月7日作成者: jarxiv

要約拡散モデルの最近の進歩により、ユーザーは自然言語でテキストプロンプトを書 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.HC, cs.LG | コメントを受け付けていません

LOANet: A Lightweight Network Using Object Attention for Extracting Buildings and Roads from UAV Aerial Remote Sensing Images

投稿日: 2023年7月7日作成者: jarxiv

要約深層学習によって無人航空機 (UAV) のリモートセンシング画像から建物 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

OSPC: Online Sequential Photometric Calibration

投稿日: 2023年7月7日作成者: jarxiv

要約フォトメトリックキャリブレーションは、多くのコンピュータビジョンアプ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

SegNetr: Rethinking the local-global interactions and skip connections in U-shaped networks

投稿日: 2023年7月7日作成者: jarxiv

要約最近、U 字型ネットワークは、その構造がシンプルで調整が容易なため、医療画 … 続きを読む →

カテゴリー: cs.CV, cs.LG, eess.IV | コメントを受け付けていません

On the Cultural Gap in Text-to-Image Generation

投稿日: 2023年7月7日作成者: jarxiv

要約 Text-to-Image (T2I) 生成における課題の 1 つは、トレ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

月別アーカイブ: 2023年7月

Towards Open Vocabulary Learning: A Survey

Adaptive Sparse ViT: Towards Learnable Adaptive Token Pruning by Fully Exploiting Self-Attention

KITE: Keypoint-Conditioned Policies for Semantic Manipulation

Image Matters: A New Dataset and Empirical Study for Multimodal Hyperbole Detection

DisAsymNet: Disentanglement of Asymmetrical Abnormality on Bilateral Mammograms using Self-adversarial Learning

DiffusionDB: A Large-scale Prompt Gallery Dataset for Text-to-Image Generative Models

LOANet: A Lightweight Network Using Object Attention for Extracting Buildings and Roads from UAV Aerial Remote Sensing Images

OSPC: Online Sequential Photometric Calibration

SegNetr: Rethinking the local-global interactions and skip connections in U-shaped networks

On the Cultural Gap in Text-to-Image Generation

最近の投稿

最近のコメント

アーカイブ

カテゴリー