月別アーカイブ: 2025年2月

Spherical Dense Text-to-Image Synthesis

要約 テキストから画像への最近の進歩(T2I)は合成結果を改善しましたが、レイア … 続きを読む

カテゴリー: cs.CV | Spherical Dense Text-to-Image Synthesis はコメントを受け付けていません

Medical Image Classification with KAN-Integrated Transformers and Dilated Neighborhood Attention

要約 畳み込みネットワーク、トランス、ハイブリッドモデル、およびMambaベース … 続きを読む

カテゴリー: cs.CV | Medical Image Classification with KAN-Integrated Transformers and Dilated Neighborhood Attention はコメントを受け付けていません

Event-Based Video Frame Interpolation With Cross-Modal Asymmetric Bidirectional Motion Fields

要約 ビデオフレーム補間(VFI)は、連続した入力フレーム間で中間ビデオフレーム … 続きを読む

カテゴリー: cs.CV | Event-Based Video Frame Interpolation With Cross-Modal Asymmetric Bidirectional Motion Fields はコメントを受け付けていません

CARE: Confidence-Aware Regression Estimation of building density fine-tuning EO Foundation Models

要約 正確な信頼性の定量化と評価を実行することは、深いニューラルネットワークが障 … 続きを読む

カテゴリー: cs.CV, cs.LG | CARE: Confidence-Aware Regression Estimation of building density fine-tuning EO Foundation Models はコメントを受け付けていません

Multimodal Fake News Video Explanation Generation: Dataset, Model, and Evaluation

要約 既存の方法は、分類の問題として偽のニュースビデオの検出に対処していますが、 … 続きを読む

カテゴリー: cs.CV, cs.MM | Multimodal Fake News Video Explanation Generation: Dataset, Model, and Evaluation はコメントを受け付けていません

Benchmarking of Different YOLO Models for CAPTCHAs Detection and Classification

要約 このペーパーでは、WebとDarkNetから収集されたデータセット、および … 続きを読む

カテゴリー: cs.CV | Benchmarking of Different YOLO Models for CAPTCHAs Detection and Classification はコメントを受け付けていません

RSNet: A Light Framework for The Detection of Multi-scale Remote Sensing Targets

要約 深い学習を使用した合成開口レーダー(SAR)船の検出の最近の進歩により、精 … 続きを読む

カテゴリー: cs.CV, eess.IV | RSNet: A Light Framework for The Detection of Multi-scale Remote Sensing Targets はコメントを受け付けていません

Capturing Rich Behavior Representations: A Dynamic Action Semantic-Aware Graph Transformer for Video Captioning

要約 既存のビデオキャプションメソッドは、オブジェクトの動作の浅いまたは単純な表 … 続きを読む

カテゴリー: cs.CV | Capturing Rich Behavior Representations: A Dynamic Action Semantic-Aware Graph Transformer for Video Captioning はコメントを受け付けていません

Geolocation with Real Human Gameplay Data: A Large-Scale Dataset and Human-Like Reasoning Framework

要約 画像の位置を識別するタスクである地理配位には、複雑な推論が必要であり、ナビ … 続きを読む

カテゴリー: cs.CV | Geolocation with Real Human Gameplay Data: A Large-Scale Dataset and Human-Like Reasoning Framework はコメントを受け付けていません

An Overall Real-Time Mechanism for Classification and Quality Evaluation of Rice

要約 米は世界で最も広く栽培されている作物の1つであり、多くの品種に発展していま … 続きを読む

カテゴリー: cs.AI, cs.CV | An Overall Real-Time Mechanism for Classification and Quality Evaluation of Rice はコメントを受け付けていません