cs.CV」カテゴリーアーカイブ

Robustness of Deep Learning for Accelerated MRI: Benefits of Diverse Training Data

要約 画像再構成のための深層学習ベースの方法は、さまざまな画像処理タスクにとって … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Robustness of Deep Learning for Accelerated MRI: Benefits of Diverse Training Data はコメントを受け付けていません

HyperKAN: Kolmogorov-Arnold Networks make Hyperspectral Image Classificators Smarter

要約 従来のニューラル ネットワーク アーキテクチャでは、通常、特徴抽出段階に続 … 続きを読む

カテゴリー: cs.CV | HyperKAN: Kolmogorov-Arnold Networks make Hyperspectral Image Classificators Smarter はコメントを受け付けていません

CAS-ViT: Convolutional Additive Self-attention Vision Transformers for Efficient Mobile Applications

要約 ビジョン トランスフォーマー (ViT) は、トークン ミキサーの強力なグ … 続きを読む

カテゴリー: cs.CV | CAS-ViT: Convolutional Additive Self-attention Vision Transformers for Efficient Mobile Applications はコメントを受け付けていません

Semantic-guided modeling of spatial relation and object co-occurrence for indoor scene recognition

要約 シーン画像の意味コンテキストを探索することは、屋内シーン認識には不可欠です … 続きを読む

カテゴリー: cs.CV | Semantic-guided modeling of spatial relation and object co-occurrence for indoor scene recognition はコメントを受け付けていません

A Backbone for Long-Horizon Robot Task Understanding

要約 エンドツーエンドのロボット学習、特に長期的なタスクの場合、多くの場合、予測 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.HC, cs.RO | A Backbone for Long-Horizon Robot Task Understanding はコメントを受け付けていません

SynopGround: A Large-Scale Dataset for Multi-Paragraph Video Grounding from TV Dramas and Synopses

要約 ビデオ グラウンディングは、マルチモーダル コンテンツの理解における基本的 … 続きを読む

カテゴリー: cs.CV, cs.MM | SynopGround: A Large-Scale Dataset for Multi-Paragraph Video Grounding from TV Dramas and Synopses はコメントを受け付けていません

Pick of the Bunch: Detecting Infrared Small Targets Beyond Hit-Miss Trade-Offs via Selective Rank-Aware Attention

要約 赤外線による小型ターゲットの検出は、複雑な背景の乱雑さの中で薄暗いターゲッ … 続きを読む

カテゴリー: cs.CV | Pick of the Bunch: Detecting Infrared Small Targets Beyond Hit-Miss Trade-Offs via Selective Rank-Aware Attention はコメントを受け付けていません

Soft-Hard Attention U-Net Model and Benchmark Dataset for Multiscale Image Shadow Removal

要約 効果的な影の除去は、コンピュータ ビジョンからデジタル写真に至るまで、さま … 続きを読む

カテゴリー: cs.CV | Soft-Hard Attention U-Net Model and Benchmark Dataset for Multiscale Image Shadow Removal はコメントを受け付けていません

Advancing Multimodal Large Language Models with Quantization-Aware Scale Learning for Efficient Adaptation

要約 この論文では、ビジョン言語命令の調整中に遭遇する重大なリソース制約を軽減す … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Advancing Multimodal Large Language Models with Quantization-Aware Scale Learning for Efficient Adaptation はコメントを受け付けていません

Intuitionistic Fuzzy Cognitive Maps for Interpretable Image Classification

要約 ユーザーは推論に頼ることに消極的な場合があるため、機械学習モデルの解釈可能 … 続きを読む

カテゴリー: cs.AI, cs.CV | Intuitionistic Fuzzy Cognitive Maps for Interpretable Image Classification はコメントを受け付けていません