月別アーカイブ: 2022年8月

Stacked BNAS: Rethinking Broad Convolutional Neural Network for Neural Architecture Search

要約 他のディープ スケーラブルなアーキテクチャ ベースの NAS アプローチと … 続きを読む

カテゴリー: cs.CV | Stacked BNAS: Rethinking Broad Convolutional Neural Network for Neural Architecture Search はコメントを受け付けていません

Joint covariate-alignment and concept-alignment: a framework for domain generalization

要約 この論文では、目に見えないドメインのリスクに対する新しい上限に基づく、新し … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Joint covariate-alignment and concept-alignment: a framework for domain generalization はコメントを受け付けていません

Retrieval of surgical phase transitions using reinforcement learning

要約 低侵襲手術では、ビデオ分析からの手術ワークフローのセグメンテーションがよく … 続きを読む

カテゴリー: cs.AI, cs.CV | Retrieval of surgical phase transitions using reinforcement learning はコメントを受け付けていません

Understanding Adversarial Robustness of Vision Transformers via Cauchy Problem

要約 深層学習のロバスト性に関する最近の研究では、ビジョン トランスフォーマー … 続きを読む

カテゴリー: cs.CV, cs.LG | Understanding Adversarial Robustness of Vision Transformers via Cauchy Problem はコメントを受け付けていません

Improved Orientation Estimation and Detection with Hybrid Object Detection Networks for Automotive Radar

要約 このホワイト ペーパーでは、グリッド ベースとポイント ベースの処理を組み … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Improved Orientation Estimation and Detection with Hybrid Object Detection Networks for Automotive Radar はコメントを受け付けていません

Benchmarking Visual-Inertial Deep Multimodal Fusion for Relative Pose Regression and Odometry-aided Absolute Pose Regression

要約 視覚慣性ローカリゼーションは、仮想現実、自動運転車、航空機などのコンピュー … 続きを読む

カテゴリー: 65D19, 68T40, cs.CV, I.4 | Benchmarking Visual-Inertial Deep Multimodal Fusion for Relative Pose Regression and Odometry-aided Absolute Pose Regression はコメントを受け付けていません

AdaWCT: Adaptive Whitening and Coloring Style Injection

要約 アダプティブ インスタンス正規化 (AdaIN) は、スタイル インジェク … 続きを読む

カテゴリー: cs.CV, eess.IV | AdaWCT: Adaptive Whitening and Coloring Style Injection はコメントを受け付けていません

OmniCity: Omnipotent City Understanding with Multi-level and Multi-view Images

要約 この論文では、マルチレベルおよびマルチビュー画像から全能都市を理解するため … 続きを読む

カテゴリー: cs.CV | OmniCity: Omnipotent City Understanding with Multi-level and Multi-view Images はコメントを受け付けていません

DAN: a Segmentation-free Document Attention Network for Handwritten Document Recognition

要約 制約のない手書きテキストの認識は、困難なコンピューター ビジョン タスクで … 続きを読む

カテゴリー: cs.CV | DAN: a Segmentation-free Document Attention Network for Handwritten Document Recognition はコメントを受け付けていません

Video Question Answering with Iterative Video-Text Co-Tokenization

要約 ビデオ質問応答は、言語入力、個々のビデオ フレームの視覚情報、およびビデオ … 続きを読む

カテゴリー: cs.CV | Video Question Answering with Iterative Video-Text Co-Tokenization はコメントを受け付けていません