月別アーカイブ: 2023年5月

Long-tailed Visual Recognition via Gaussian Clouded Logit Adjustment

要約 ディープ ニューラル ネットワークはバランスの取れたデータで大きな成功を収 … 続きを読む

カテゴリー: cs.CV | Long-tailed Visual Recognition via Gaussian Clouded Logit Adjustment はコメントを受け付けていません

Survey of Automatic Plankton Image Recognition: Challenges, Existing Solutions and Future Perspectives

要約 浮遊生物は水生生態系の重要な構成要素であり、環境の変化に迅速に反応するため … 続きを読む

カテゴリー: cs.CV | Survey of Automatic Plankton Image Recognition: Challenges, Existing Solutions and Future Perspectives はコメントを受け付けていません

TaLU: A Hybrid Activation Function Combining Tanh and Rectified Linear Unit to Enhance Neural Networks

要約 分類における深層学習モデルの適用は、ターゲット オブジェクトの正確な検出に … 続きを読む

カテゴリー: cs.CV | TaLU: A Hybrid Activation Function Combining Tanh and Rectified Linear Unit to Enhance Neural Networks はコメントを受け付けていません

Generating Visual Spatial Description via Holistic 3D Scene Understanding

要約 視覚的空間記述 (VSD) は、画像内の特定のオブジェクトの空間関係を説明 … 続きを読む

カテゴリー: cs.CL, cs.CV | Generating Visual Spatial Description via Holistic 3D Scene Understanding はコメントを受け付けていません

Enhancing Vision-Language Pre-Training with Jointly Learned Questioner and Dense Captioner

要約 大規模な事前トレーニング済みマルチモーダル モデルは、画像キャプション、画 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | Enhancing Vision-Language Pre-Training with Jointly Learned Questioner and Dense Captioner はコメントを受け付けていません

Neural Foundations of Mental Simulation: Future Prediction of Latent Representations on Dynamic Scenes

要約 人間と動物は物理世界について豊かかつ柔軟な理解を持っており、それによって物 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO, q-bio.NC | Neural Foundations of Mental Simulation: Future Prediction of Latent Representations on Dynamic Scenes はコメントを受け付けていません

Dynamic Sparse Training with Structured Sparsity

要約 ダイナミック スパース トレーニング (DST) 手法は、スパース ニュー … 続きを読む

カテゴリー: cs.CV, cs.LG | Dynamic Sparse Training with Structured Sparsity はコメントを受け付けていません

A One-Class Classifier for the Detection of GAN Manipulated Multi-Spectral Satellite Images

要約 現在の画像生成モデルによって実現される非常にリアルな画像品質は、多くの学術 … 続きを読む

カテゴリー: cs.CV, eess.IV | A One-Class Classifier for the Detection of GAN Manipulated Multi-Spectral Satellite Images はコメントを受け付けていません

A Comprehensive Survey on Segment Anything Model for Vision and Beyond

要約 人工知能 (AI) は、汎用人工知能に向けて進化しています。これは、幅広い … 続きを読む

カテゴリー: cs.AI, cs.CV | A Comprehensive Survey on Segment Anything Model for Vision and Beyond はコメントを受け付けていません

MaGIC: Multi-modality Guided Image Completion

要約 バニラ イメージの補完アプローチは、妥当な生成に使用できる参照情報が限られ … 続きを読む

カテゴリー: cs.CV | MaGIC: Multi-modality Guided Image Completion はコメントを受け付けていません