cs.CV」カテゴリーアーカイブ

Tailored Design of Audio-Visual Speech Recognition Models using Branchformers

要約 視聴覚音声認識(AVSR)の最近の進歩により、この分野では前例のない成果が … 続きを読む

カテゴリー: cs.CL, cs.CV | Tailored Design of Audio-Visual Speech Recognition Models using Branchformers はコメントを受け付けていません

Enhancing Target-unspecific Tasks through a Features Matrix

要約 大規模なビジョン言語モデルの迅速な学習の最近の開発により、ターゲット固有の … 続きを読む

カテゴリー: cs.CL, cs.CV | Enhancing Target-unspecific Tasks through a Features Matrix はコメントを受け付けていません

From Neurons to Computation: Biological Reservoir Computing for Pattern Recognition

要約 この論文では、培養された生物学的ニューロンのプールを貯水池基板として活用し … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.NE | From Neurons to Computation: Biological Reservoir Computing for Pattern Recognition はコメントを受け付けていません

Optimization of Module Transferability in Single Image Super-Resolution: Universality Assessment and Cycle Residual Blocks

要約 ディープラーニングは、単一の画像超解像度(SISR)を大幅に進めています。 … 続きを読む

カテゴリー: cs.AI, cs.CV | Optimization of Module Transferability in Single Image Super-Resolution: Universality Assessment and Cycle Residual Blocks はコメントを受け付けていません

Coop-WD: Cooperative Perception with Weighting and Denoising for Robust V2V Communication

要約 協力的な認識、車両から車両(V2V)通信を介して複数の車両からの共有情報を … 続きを読む

カテゴリー: cs.CV | Coop-WD: Cooperative Perception with Weighting and Denoising for Robust V2V Communication はコメントを受け付けていません

OSMamba: Omnidirectional Spectral Mamba with Dual-Domain Prior Generator for Exposure Correction

要約 露出補正は、コンピュータービジョンと画像処理の根本的な問題です。 最近、周 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | OSMamba: Omnidirectional Spectral Mamba with Dual-Domain Prior Generator for Exposure Correction はコメントを受け付けていません

RAIL: Region-Aware Instructive Learning for Semi-Supervised Tooth Segmentation in CBCT

要約 半教師の学習は、ラベル付きデータが最小限であるCBCTスキャンからの3D歯 … 続きを読む

カテゴリー: cs.CV | RAIL: Region-Aware Instructive Learning for Semi-Supervised Tooth Segmentation in CBCT はコメントを受け付けていません

Panoramic Out-of-Distribution Segmentation

要約 パノラマイメージングにより、密度の高い全方向性知覚のために、超幅の視野フィ … 続きを読む

カテゴリー: cs.CV, cs.RO, eess.IV | Panoramic Out-of-Distribution Segmentation はコメントを受け付けていません

A Cognitive Paradigm Approach to Probe the Perception-Reasoning Interface in VLMs

要約 人工知能の基本的な課題は、ビジョン言語モデル(VLM)などの洗練されたモデ … 続きを読む

カテゴリー: cs.AI, cs.CV | A Cognitive Paradigm Approach to Probe the Perception-Reasoning Interface in VLMs はコメントを受け付けていません

Beyond Bare Queries: Open-Vocabulary Object Grounding with 3D Scene Graph

要約 自然言語で説明されているオブジェクトを見つけることは、自律剤にとって重要な … 続きを読む

カテゴリー: cs.AI, cs.CV | Beyond Bare Queries: Open-Vocabulary Object Grounding with 3D Scene Graph はコメントを受け付けていません