cs.CV」カテゴリーアーカイブ

Dense Center-Direction Regression for Object Counting and Localization with Point Supervision

要約 オブジェクトの計数と位置特定の問題は、一般的にポイント教師あり学習で対処さ … 続きを読む

カテゴリー: cs.CV | Dense Center-Direction Regression for Object Counting and Localization with Point Supervision はコメントを受け付けていません

Grounded Multi-Hop VideoQA in Long-Form Egocentric Videos

要約 この論文では、長い形式の自己中心的なビデオにおけるマルチホップ ビデオ質問 … 続きを読む

カテゴリー: cs.CV | Grounded Multi-Hop VideoQA in Long-Form Egocentric Videos はコメントを受け付けていません

A Practitioner’s Guide to Continual Multimodal Pretraining

要約 マルチモーダル基盤モデルは、視覚と言語の交差点で数多くのアプリケーションに … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | A Practitioner’s Guide to Continual Multimodal Pretraining はコメントを受け付けていません

Global Attractor for a Reaction-Diffusion Model Arising in Biological Dynamic in 3D Soil Structure

要約 偏微分方程式 (PDE) は、特に生物学の領域において、複雑な自然プロセス … 続きを読む

カテゴリー: cs.CV | Global Attractor for a Reaction-Diffusion Model Arising in Biological Dynamic in 3D Soil Structure はコメントを受け付けていません

Multi-head Spatial-Spectral Mamba for Hyperspectral Image Classification

要約 Spatial-Spectral Mamba (SSM) は、計算効率を向 … 続きを読む

カテゴリー: cs.CV | Multi-head Spatial-Spectral Mamba for Hyperspectral Image Classification はコメントを受け付けていません

Focus on Neighbors and Know the Whole: Towards Consistent Dense Multiview Text-to-Image Generator for 3D Creation

要約 テキスト プロンプトから高密度のマルチビュー イメージを生成することは、忠 … 続きを読む

カテゴリー: cs.CV | Focus on Neighbors and Know the Whole: Towards Consistent Dense Multiview Text-to-Image Generator for 3D Creation はコメントを受け付けていません

One-shot Video Imitation via Parameterized Symbolic Abstraction Graphs

要約 単一のデモンストレーション ビデオから動的で変形可能なオブジェクトを操作す … 続きを読む

カテゴリー: cs.CV, cs.RO | One-shot Video Imitation via Parameterized Symbolic Abstraction Graphs はコメントを受け付けていません

VALE: A Multimodal Visual and Language Explanation Framework for Image Classifiers using eXplainable AI and Language Models

要約 ディープ ニューラル ネットワーク (DNN) は、タスクの自動化を可能に … 続きを読む

カテゴリー: (Primary), 68U10, cs.AI, cs.CL, cs.CV, cs.LG, I.2.10 | VALE: A Multimodal Visual and Language Explanation Framework for Image Classifiers using eXplainable AI and Language Models はコメントを受け付けていません

Spatial-Spectral Morphological Mamba for Hyperspectral Image Classification

要約 近年、自己注意メカニズムを備えたトランスフォーマーの出現により、ハイパース … 続きを読む

カテゴリー: cs.CV, eess.IV | Spatial-Spectral Morphological Mamba for Hyperspectral Image Classification はコメントを受け付けていません

Multi-head Spatial-Spectral Mamba for Hyperspectral Image Classification

要約 Spatial-Spectral Mamba (SSM) は、計算効率を向 … 続きを読む

カテゴリー: cs.CV | Multi-head Spatial-Spectral Mamba for Hyperspectral Image Classification はコメントを受け付けていません