月別アーカイブ: 2022年8月

Image as a Foreign Language: BEiT Pretraining for All Vision and Vision-Language Tasks

投稿日: 2022年8月23日作成者: jarxiv

要約言語、ビジョン、およびマルチモーダル事前トレーニングの大きな収束が生じてい … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

SCONE: Surface Coverage Optimization in Unknown Environments by Volumetric Integration

投稿日: 2022年8月23日作成者: jarxiv

要約 Next Best View 計算 (NBV) は、ロボット工学における長 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

GIT: A Generative Image-to-text Transformer for Vision and Language

投稿日: 2022年8月23日作成者: jarxiv

要約このホワイトペーパーでは、Generative Image-to-Tex … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

BARReL: Bottleneck Attention for Adversarial Robustness in Vision-Based Reinforcement Learning

投稿日: 2022年8月23日作成者: jarxiv

要約敵対的摂動に対するロバスト性は、コンピュータービジョンの多くの分野で調査 … 続きを読む →

カテゴリー: cs.AI, cs.CR, cs.CV, cs.LG, cs.RO, I.2.10 | コメントを受け付けていません

Wildfire Forecasting with Satellite Images and Deep Generative Model

投稿日: 2022年8月23日作成者: jarxiv

要約山火事の予測は、人文科学が成功を収めたいと考えている最も重要なタスクの 1 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Improved Image Classification with Token Fusion

投稿日: 2022年8月22日作成者: jarxiv

要約この論文では、CNN と変換器構造の融合を使用して画像分類性能を向上させる … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Synthetic Data in Human Analysis: A Survey

投稿日: 2022年8月22日作成者: jarxiv

要約ディープニューラルネットワークは人間の分析で普及しており、生体認証、行 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Real-Time Robust Video Object Detection System Against Physical-World Adversarial Attacks

投稿日: 2022年8月22日作成者: jarxiv

要約 DNN ベースのビデオオブジェクト検出 (VOD) は、自動運転およびビ … 続きを読む →

カテゴリー: cs.AR, cs.CR, cs.CV, cs.LG | コメントを受け付けていません

EAA-Net: Rethinking the Autoencoder Architecture with Intra-class Features for Medical Image Segmentation

投稿日: 2022年8月22日作成者: jarxiv

要約自動画像セグメンテーション技術は、視覚的な分析に不可欠です。オートエンコ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

TTT-UCDR: Test-time Training for Universal Cross-Domain Retrieval

投稿日: 2022年8月22日作成者: jarxiv

要約画像検索は、クエリを使用してデータベース内の類似の画像を見つけることを目的 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

月別アーカイブ: 2022年8月

Image as a Foreign Language: BEiT Pretraining for All Vision and Vision-Language Tasks

SCONE: Surface Coverage Optimization in Unknown Environments by Volumetric Integration

GIT: A Generative Image-to-text Transformer for Vision and Language

BARReL: Bottleneck Attention for Adversarial Robustness in Vision-Based Reinforcement Learning

Wildfire Forecasting with Satellite Images and Deep Generative Model

Improved Image Classification with Token Fusion

Synthetic Data in Human Analysis: A Survey

Real-Time Robust Video Object Detection System Against Physical-World Adversarial Attacks

EAA-Net: Rethinking the Autoencoder Architecture with Intra-class Features for Medical Image Segmentation

TTT-UCDR: Test-time Training for Universal Cross-Domain Retrieval

最近の投稿

最近のコメント

アーカイブ

カテゴリー