「cs.CV」カテゴリーアーカイブ

Dense Center-Direction Regression for Object Counting and Localization with Point Supervision

投稿日: 2024年8月27日作成者: jarxiv

要約オブジェクトの計数と位置特定の問題は、一般的にポイント教師あり学習で対処さ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Grounded Multi-Hop VideoQA in Long-Form Egocentric Videos

投稿日: 2024年8月27日作成者: jarxiv

要約この論文では、長い形式の自己中心的なビデオにおけるマルチホップビデオ質問 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

A Practitioner’s Guide to Continual Multimodal Pretraining

投稿日: 2024年8月27日作成者: jarxiv

要約マルチモーダル基盤モデルは、視覚と言語の交差点で数多くのアプリケーションに … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Global Attractor for a Reaction-Diffusion Model Arising in Biological Dynamic in 3D Soil Structure

投稿日: 2024年8月27日作成者: jarxiv

要約偏微分方程式 (PDE) は、特に生物学の領域において、複雑な自然プロセス … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Multi-head Spatial-Spectral Mamba for Hyperspectral Image Classification

投稿日: 2024年8月27日作成者: jarxiv

要約 Spatial-Spectral Mamba (SSM) は、計算効率を向 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Focus on Neighbors and Know the Whole: Towards Consistent Dense Multiview Text-to-Image Generator for 3D Creation

投稿日: 2024年8月27日作成者: jarxiv

要約テキストプロンプトから高密度のマルチビューイメージを生成することは、忠 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

One-shot Video Imitation via Parameterized Symbolic Abstraction Graphs

投稿日: 2024年8月26日作成者: jarxiv

要約単一のデモンストレーションビデオから動的で変形可能なオブジェクトを操作す … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

VALE: A Multimodal Visual and Language Explanation Framework for Image Classifiers using eXplainable AI and Language Models

投稿日: 2024年8月26日作成者: jarxiv

要約ディープニューラルネットワーク (DNN) は、タスクの自動化を可能に … 続きを読む →

カテゴリー: (Primary), 68U10, cs.AI, cs.CL, cs.CV, cs.LG, I.2.10 | コメントを受け付けていません

Spatial-Spectral Morphological Mamba for Hyperspectral Image Classification

投稿日: 2024年8月26日作成者: jarxiv

要約近年、自己注意メカニズムを備えたトランスフォーマーの出現により、ハイパース … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

Multi-head Spatial-Spectral Mamba for Hyperspectral Image Classification

投稿日: 2024年8月26日作成者: jarxiv

要約 Spatial-Spectral Mamba (SSM) は、計算効率を向 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Dense Center-Direction Regression for Object Counting and Localization with Point Supervision

Grounded Multi-Hop VideoQA in Long-Form Egocentric Videos

A Practitioner’s Guide to Continual Multimodal Pretraining

Global Attractor for a Reaction-Diffusion Model Arising in Biological Dynamic in 3D Soil Structure

Multi-head Spatial-Spectral Mamba for Hyperspectral Image Classification

Focus on Neighbors and Know the Whole: Towards Consistent Dense Multiview Text-to-Image Generator for 3D Creation

One-shot Video Imitation via Parameterized Symbolic Abstraction Graphs

VALE: A Multimodal Visual and Language Explanation Framework for Image Classifiers using eXplainable AI and Language Models

Spatial-Spectral Morphological Mamba for Hyperspectral Image Classification

Multi-head Spatial-Spectral Mamba for Hyperspectral Image Classification

最近の投稿

最近のコメント

アーカイブ

カテゴリー