月別アーカイブ: 2022年8月

Image as a Foreign Language: BEiT Pretraining for All Vision and Vision-Language Tasks

要約 言語、ビジョン、およびマルチモーダル事前トレーニングの大きな収束が生じてい … 続きを読む

カテゴリー: cs.CL, cs.CV | Image as a Foreign Language: BEiT Pretraining for All Vision and Vision-Language Tasks はコメントを受け付けていません

SCONE: Surface Coverage Optimization in Unknown Environments by Volumetric Integration

要約 Next Best View 計算 (NBV) は、ロボット工学における長 … 続きを読む

カテゴリー: cs.CV, cs.RO | SCONE: Surface Coverage Optimization in Unknown Environments by Volumetric Integration はコメントを受け付けていません

GIT: A Generative Image-to-text Transformer for Vision and Language

要約 このホワイト ペーパーでは、Generative Image-to-Tex … 続きを読む

カテゴリー: cs.CV | GIT: A Generative Image-to-text Transformer for Vision and Language はコメントを受け付けていません

BARReL: Bottleneck Attention for Adversarial Robustness in Vision-Based Reinforcement Learning

要約 敵対的摂動に対するロバスト性は、コンピューター ビジョンの多くの分野で調査 … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.CV, cs.LG, cs.RO, I.2.10 | BARReL: Bottleneck Attention for Adversarial Robustness in Vision-Based Reinforcement Learning はコメントを受け付けていません

Wildfire Forecasting with Satellite Images and Deep Generative Model

要約 山火事の予測は、人文科学が成功を収めたいと考えている最も重要なタスクの 1 … 続きを読む

カテゴリー: cs.CV | Wildfire Forecasting with Satellite Images and Deep Generative Model はコメントを受け付けていません

Improved Image Classification with Token Fusion

要約 この論文では、CNN と変換器構造の融合を使用して画像分類性能を向上させる … 続きを読む

カテゴリー: cs.AI, cs.CV | Improved Image Classification with Token Fusion はコメントを受け付けていません

Synthetic Data in Human Analysis: A Survey

要約 ディープ ニューラル ネットワークは人間の分析で普及しており、生体認証、行 … 続きを読む

カテゴリー: cs.CV | Synthetic Data in Human Analysis: A Survey はコメントを受け付けていません

Real-Time Robust Video Object Detection System Against Physical-World Adversarial Attacks

要約 DNN ベースのビデオ オブジェクト検出 (VOD) は、自動運転およびビ … 続きを読む

カテゴリー: cs.AR, cs.CR, cs.CV, cs.LG | Real-Time Robust Video Object Detection System Against Physical-World Adversarial Attacks はコメントを受け付けていません

EAA-Net: Rethinking the Autoencoder Architecture with Intra-class Features for Medical Image Segmentation

要約 自動画像セグメンテーション技術は、視覚的な分析に不可欠です。 オートエンコ … 続きを読む

カテゴリー: cs.CV | EAA-Net: Rethinking the Autoencoder Architecture with Intra-class Features for Medical Image Segmentation はコメントを受け付けていません

TTT-UCDR: Test-time Training for Universal Cross-Domain Retrieval

要約 画像検索は、クエリを使用してデータベース内の類似の画像を見つけることを目的 … 続きを読む

カテゴリー: cs.CV | TTT-UCDR: Test-time Training for Universal Cross-Domain Retrieval はコメントを受け付けていません