月別アーカイブ: 2025年5月

Achieving 3D Attention via Triplet Squeeze and Excitation Block

投稿日: 2025年5月12日作成者: jarxiv

要約 Convnextとそのバリアントの出現により、視力課題のCNNベースのモデ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Efficient Quantum Convolutional Neural Networks for Image Classification: Overcoming Hardware Constraints

投稿日: 2025年5月12日作成者: jarxiv

要約古典的な畳み込みニューラルネットワーク（CNN）は画像分類に革命をもたらし … 続きを読む →

カテゴリー: cs.CV, cs.LG, quant-ph | コメントを受け付けていません

Leveraging Automatic CAD Annotations for Supervised Learning in 3D Scene Understanding

投稿日: 2025年5月12日作成者: jarxiv

要約多くのアプリケーションでは、高レベルの3Dシーンの理解が不可欠です。ただ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Foundation Models For Seismic Data Processing: An Extensive Review

投稿日: 2025年5月12日作成者: jarxiv

要約地震加工は、生データをさまざまな地球科学アプリケーションに極めて高品質の地 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

FF-PNet: A Pyramid Network Based on Feature and Field for Brain Image Registration

投稿日: 2025年5月12日作成者: jarxiv

要約近年、変形可能な医療画像登録手法が大きな進歩を遂げています。ただし、既存 … 続きを読む →

カテゴリー: cs.CV, cs.IR | コメントを受け付けていません

Locality-aware Cross-modal Correspondence Learning for Dense Audio-Visual Events Localization

投稿日: 2025年5月12日作成者: jarxiv

要約高密度ローカリゼーションの視聴覚イベント（Dave）は、イベントがさまざま … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Task-Adapter++: Task-specific Adaptation with Order-aware Alignment for Few-shot Action Recognition

投稿日: 2025年5月12日作成者: jarxiv

要約大規模な事前に訓練されたモデルは、言語および画像タスクで顕著な成功を収めて … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

From Pixels to Perception: Interpretable Predictions via Instance-wise Grouped Feature Selection

投稿日: 2025年5月12日作成者: jarxiv

要約機械学習モデルの意思決定プロセスを理解することで、モデルの障害の背後にある … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

ArtRAG: Retrieval-Augmented Generation with Structured Context for Visual Art Understanding

投稿日: 2025年5月12日作成者: jarxiv

要約視覚芸術を理解するには、文化的、歴史的、文体的な文化的、文体的な認識を超え … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Why Are You Wrong? Counterfactual Explanations for Language Grounding with 3D Objects

投稿日: 2025年5月12日作成者: jarxiv

要約自然言語と幾何学的形状を組み合わせることは、ロボット工学と言語支援設計に複 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

月別アーカイブ: 2025年5月

Achieving 3D Attention via Triplet Squeeze and Excitation Block

Efficient Quantum Convolutional Neural Networks for Image Classification: Overcoming Hardware Constraints

Leveraging Automatic CAD Annotations for Supervised Learning in 3D Scene Understanding

Foundation Models For Seismic Data Processing: An Extensive Review

FF-PNet: A Pyramid Network Based on Feature and Field for Brain Image Registration

Locality-aware Cross-modal Correspondence Learning for Dense Audio-Visual Events Localization

Task-Adapter++: Task-specific Adaptation with Order-aware Alignment for Few-shot Action Recognition

From Pixels to Perception: Interpretable Predictions via Instance-wise Grouped Feature Selection

ArtRAG: Retrieval-Augmented Generation with Structured Context for Visual Art Understanding

Why Are You Wrong? Counterfactual Explanations for Language Grounding with 3D Objects

最近の投稿

最近のコメント

アーカイブ

カテゴリー