「cs.CV」カテゴリーアーカイブ

Tailored Design of Audio-Visual Speech Recognition Models using Branchformers

投稿日: 2025年5月7日作成者: jarxiv

要約視聴覚音声認識（AVSR）の最近の進歩により、この分野では前例のない成果が … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Enhancing Target-unspecific Tasks through a Features Matrix

投稿日: 2025年5月7日作成者: jarxiv

要約大規模なビジョン言語モデルの迅速な学習の最近の開発により、ターゲット固有の … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

From Neurons to Computation: Biological Reservoir Computing for Pattern Recognition

投稿日: 2025年5月7日作成者: jarxiv

要約この論文では、培養された生物学的ニューロンのプールを貯水池基板として活用し … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.NE | コメントを受け付けていません

Optimization of Module Transferability in Single Image Super-Resolution: Universality Assessment and Cycle Residual Blocks

投稿日: 2025年5月7日作成者: jarxiv

要約ディープラーニングは、単一の画像超解像度（SISR）を大幅に進めています。 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Coop-WD: Cooperative Perception with Weighting and Denoising for Robust V2V Communication

投稿日: 2025年5月7日作成者: jarxiv

要約協力的な認識、車両から車両（V2V）通信を介して複数の車両からの共有情報を … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

OSMamba: Omnidirectional Spectral Mamba with Dual-Domain Prior Generator for Exposure Correction

投稿日: 2025年5月7日作成者: jarxiv

要約露出補正は、コンピュータービジョンと画像処理の根本的な問題です。最近、周 … 続きを読む →

カテゴリー: cs.CV, cs.LG, eess.IV | コメントを受け付けていません

RAIL: Region-Aware Instructive Learning for Semi-Supervised Tooth Segmentation in CBCT

投稿日: 2025年5月7日作成者: jarxiv

要約半教師の学習は、ラベル付きデータが最小限であるCBCTスキャンからの3D歯 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Panoramic Out-of-Distribution Segmentation

投稿日: 2025年5月7日作成者: jarxiv

要約パノラマイメージングにより、密度の高い全方向性知覚のために、超幅の視野フィ … 続きを読む →

カテゴリー: cs.CV, cs.RO, eess.IV | コメントを受け付けていません

A Cognitive Paradigm Approach to Probe the Perception-Reasoning Interface in VLMs

投稿日: 2025年5月7日作成者: jarxiv

要約人工知能の基本的な課題は、ビジョン言語モデル（VLM）などの洗練されたモデ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Beyond Bare Queries: Open-Vocabulary Object Grounding with 3D Scene Graph

投稿日: 2025年5月7日作成者: jarxiv

要約自然言語で説明されているオブジェクトを見つけることは、自律剤にとって重要な … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Tailored Design of Audio-Visual Speech Recognition Models using Branchformers

Enhancing Target-unspecific Tasks through a Features Matrix

From Neurons to Computation: Biological Reservoir Computing for Pattern Recognition

Optimization of Module Transferability in Single Image Super-Resolution: Universality Assessment and Cycle Residual Blocks

Coop-WD: Cooperative Perception with Weighting and Denoising for Robust V2V Communication

OSMamba: Omnidirectional Spectral Mamba with Dual-Domain Prior Generator for Exposure Correction

RAIL: Region-Aware Instructive Learning for Semi-Supervised Tooth Segmentation in CBCT

Panoramic Out-of-Distribution Segmentation

A Cognitive Paradigm Approach to Probe the Perception-Reasoning Interface in VLMs

Beyond Bare Queries: Open-Vocabulary Object Grounding with 3D Scene Graph

最近の投稿

最近のコメント

アーカイブ

カテゴリー