月別アーカイブ: 2025年5月

Achieving 3D Attention via Triplet Squeeze and Excitation Block

要約 Convnextとそのバリアントの出現により、視力課題のCNNベースのモデ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Achieving 3D Attention via Triplet Squeeze and Excitation Block はコメントを受け付けていません

Efficient Quantum Convolutional Neural Networks for Image Classification: Overcoming Hardware Constraints

要約 古典的な畳み込みニューラルネットワーク(CNN)は画像分類に革命をもたらし … 続きを読む

カテゴリー: cs.CV, cs.LG, quant-ph | Efficient Quantum Convolutional Neural Networks for Image Classification: Overcoming Hardware Constraints はコメントを受け付けていません

Leveraging Automatic CAD Annotations for Supervised Learning in 3D Scene Understanding

要約 多くのアプリケーションでは、高レベルの3Dシーンの理解が不可欠です。 ただ … 続きを読む

カテゴリー: cs.CV | Leveraging Automatic CAD Annotations for Supervised Learning in 3D Scene Understanding はコメントを受け付けていません

Foundation Models For Seismic Data Processing: An Extensive Review

要約 地震加工は、生データをさまざまな地球科学アプリケーションに極めて高品質の地 … 続きを読む

カテゴリー: cs.CV | Foundation Models For Seismic Data Processing: An Extensive Review はコメントを受け付けていません

FF-PNet: A Pyramid Network Based on Feature and Field for Brain Image Registration

要約 近年、変形可能な医療画像登録手法が大きな進歩を遂げています。 ただし、既存 … 続きを読む

カテゴリー: cs.CV, cs.IR | FF-PNet: A Pyramid Network Based on Feature and Field for Brain Image Registration はコメントを受け付けていません

Locality-aware Cross-modal Correspondence Learning for Dense Audio-Visual Events Localization

要約 高密度ローカリゼーションの視聴覚イベント(Dave)は、イベントがさまざま … 続きを読む

カテゴリー: cs.CV | Locality-aware Cross-modal Correspondence Learning for Dense Audio-Visual Events Localization はコメントを受け付けていません

Task-Adapter++: Task-specific Adaptation with Order-aware Alignment for Few-shot Action Recognition

要約 大規模な事前に訓練されたモデルは、言語および画像タスクで顕著な成功を収めて … 続きを読む

カテゴリー: cs.CV | Task-Adapter++: Task-specific Adaptation with Order-aware Alignment for Few-shot Action Recognition はコメントを受け付けていません

From Pixels to Perception: Interpretable Predictions via Instance-wise Grouped Feature Selection

要約 機械学習モデルの意思決定プロセスを理解することで、モデルの障害の背後にある … 続きを読む

カテゴリー: cs.CV, cs.LG | From Pixels to Perception: Interpretable Predictions via Instance-wise Grouped Feature Selection はコメントを受け付けていません

ArtRAG: Retrieval-Augmented Generation with Structured Context for Visual Art Understanding

要約 視覚芸術を理解するには、文化的、歴史的、文体的な文化的、文体的な認識を超え … 続きを読む

カテゴリー: cs.AI, cs.CV | ArtRAG: Retrieval-Augmented Generation with Structured Context for Visual Art Understanding はコメントを受け付けていません

Why Are You Wrong? Counterfactual Explanations for Language Grounding with 3D Objects

要約 自然言語と幾何学的形状を組み合わせることは、ロボット工学と言語支援設計に複 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Why Are You Wrong? Counterfactual Explanations for Language Grounding with 3D Objects はコメントを受け付けていません