I.2.10」カテゴリーアーカイブ

Randomized Sharpness-Aware Training for Boosting Computational Efficiency in Deep Learning

要約 タイトル:深層学習の計算効率を向上させるためのランダム化シャープネス認識ト … 続きを読む

カテゴリー: 68T05, cs.AI, cs.LG, I.2.10 | Randomized Sharpness-Aware Training for Boosting Computational Efficiency in Deep Learning はコメントを受け付けていません

Text-Conditioned Sampling Framework for Text-to-Image Generation with Masked Generative Models

要約 タイトル:マスク生成モデルを用いたテキストから画像生成のためのテキスト条件 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG, I.2.10 | Text-Conditioned Sampling Framework for Text-to-Image Generation with Masked Generative Models はコメントを受け付けていません

LatentForensics: Towards lighter deepfake detection in the StyleGAN latent space

要約 タイトル:StyleGANの潜在空間でより軽量なディープフェイク検出に向け … 続きを読む

カテゴリー: 68T45, cs.CV, I.2.10 | LatentForensics: Towards lighter deepfake detection in the StyleGAN latent space はコメントを受け付けていません

All4One: Symbiotic Neighbour Contrastive Learning via Self-Attention and Redundancy Reduction

要約 Nearest Neighbor ベースの方法は、一般化機能が高いため、最 … 続きを読む

カテゴリー: cs.CV, I.2.10 | All4One: Symbiotic Neighbour Contrastive Learning via Self-Attention and Redundancy Reduction はコメントを受け付けていません

Thunderstorm nowcasting with deep learning: a multi-hazard data fusion model

要約 雷雨関連の災害の予測は、最初の対応者、インフラ管理、航空など、いくつかの分 … 続きを読む

カテゴリー: cs.LG, I.2.10, physics.ao-ph | Thunderstorm nowcasting with deep learning: a multi-hazard data fusion model はコメントを受け付けていません

Video Question Answering Using CLIP-Guided Visual-Text Attention

要約 ビデオとテキストのクロスモーダル学習は、ビデオ質問応答 (VideoQA) … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM, I.2.10 | Video Question Answering Using CLIP-Guided Visual-Text Attention はコメントを受け付けていません

RADAM: Texture Recognition through Randomized Aggregated Encoding of Deep Activation Maps

要約 テクスチャ分析は、ディープ ニューラル ネットワークが積極的に適用されてい … 続きを読む

カテゴリー: cs.CV, cs.NE, I.2.10 | RADAM: Texture Recognition through Randomized Aggregated Encoding of Deep Activation Maps はコメントを受け付けていません

Video Question Answering Using CLIP-Guided Visual-Text Attention

要約 Video Question Answering (VideoQA)では、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM, I.2.10 | Video Question Answering Using CLIP-Guided Visual-Text Attention はコメントを受け付けていません

Marker-based Visual SLAM leveraging Hierarchical Representations

要約 基準マーカーは、環境に関する豊富な情報をエンコードでき、実用的なセマンティ … 続きを読む

カテゴリー: cs.RO, I.2.10 | Marker-based Visual SLAM leveraging Hierarchical Representations はコメントを受け付けていません

Risk-aware Path Planning via Probabilistic Fusion of Traversability Prediction for Planetary Rovers on Heterogeneous Terrains

要約 機械学習 (ML) は、変形可能な地形での自律ローバー操作の通過可能性を評 … 続きを読む

カテゴリー: cs.LG, cs.RO, I.2.10 | Risk-aware Path Planning via Probabilistic Fusion of Traversability Prediction for Planetary Rovers on Heterogeneous Terrains はコメントを受け付けていません