月別アーカイブ: 2023年7月

Towards Open Vocabulary Learning: A Survey

要約 視覚的なシーンの理解の分野では、ディープ ニューラル ネットワークは、セグ … 続きを読む

カテゴリー: cs.AI, cs.CV | Towards Open Vocabulary Learning: A Survey はコメントを受け付けていません

Adaptive Sparse ViT: Towards Learnable Adaptive Token Pruning by Fully Exploiting Self-Attention

要約 ビジョン トランスフォーマーは、コンピューター ビジョンの新しいパラダイム … 続きを読む

カテゴリー: cs.CV | Adaptive Sparse ViT: Towards Learnable Adaptive Token Pruning by Fully Exploiting Self-Attention はコメントを受け付けていません

KITE: Keypoint-Conditioned Policies for Semantic Manipulation

要約 自然言語は人間とロボットに便利な共有インターフェイスを提供しますが、ロボッ … 続きを読む

カテゴリー: cs.CV, cs.RO | KITE: Keypoint-Conditioned Policies for Semantic Manipulation はコメントを受け付けていません

Image Matters: A New Dataset and Empirical Study for Multimodal Hyperbole Detection

要約 誇張、または誇張は一般的な言語現象です。 誇張の検出は人間の表現を理解する … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Image Matters: A New Dataset and Empirical Study for Multimodal Hyperbole Detection はコメントを受け付けていません

DisAsymNet: Disentanglement of Asymmetrical Abnormality on Bilateral Mammograms using Self-adversarial Learning

要約 非対称性は、異常が発生している場合の両側マンモグラム (Bi-MG) の重 … 続きを読む

カテゴリー: cs.CV | DisAsymNet: Disentanglement of Asymmetrical Abnormality on Bilateral Mammograms using Self-adversarial Learning はコメントを受け付けていません

DiffusionDB: A Large-scale Prompt Gallery Dataset for Text-to-Image Generative Models

要約 拡散モデルの最近の進歩により、ユーザーは自然言語でテキスト プロンプトを書 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.HC, cs.LG | DiffusionDB: A Large-scale Prompt Gallery Dataset for Text-to-Image Generative Models はコメントを受け付けていません

LOANet: A Lightweight Network Using Object Attention for Extracting Buildings and Roads from UAV Aerial Remote Sensing Images

要約 深層学習によって無人航空機 (UAV) のリモート センシング画像から建物 … 続きを読む

カテゴリー: cs.CV | LOANet: A Lightweight Network Using Object Attention for Extracting Buildings and Roads from UAV Aerial Remote Sensing Images はコメントを受け付けていません

OSPC: Online Sequential Photometric Calibration

要約 フォトメトリック キャリブレーションは、多くのコンピュータ ビジョン アプ … 続きを読む

カテゴリー: cs.CV | OSPC: Online Sequential Photometric Calibration はコメントを受け付けていません

SegNetr: Rethinking the local-global interactions and skip connections in U-shaped networks

要約 最近、U 字型ネットワークは、その構造がシンプルで調整が容易なため、医療画 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | SegNetr: Rethinking the local-global interactions and skip connections in U-shaped networks はコメントを受け付けていません

On the Cultural Gap in Text-to-Image Generation

要約 Text-to-Image (T2I) 生成における課題の 1 つは、トレ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | On the Cultural Gap in Text-to-Image Generation はコメントを受け付けていません