cs.CV」カテゴリーアーカイブ

3D Densification for Multi-Map Monocular VSLAM in Endoscopy

要約 単眼内視鏡配列に適用されるマルチマップスパースの単眼の視覚同時局在とマッピ … 続きを読む

カテゴリー: cs.CV | 3D Densification for Multi-Map Monocular VSLAM in Endoscopy はコメントを受け付けていません

Hadamard Attention Recurrent Transformer: A Strong Baseline for Stereo Matching Transformer

要約 トランステクノロジーの進歩に照らして、現存する研究は、双眼ステレオマッチン … 続きを読む

カテゴリー: cs.CV | Hadamard Attention Recurrent Transformer: A Strong Baseline for Stereo Matching Transformer はコメントを受け付けていません

VEGGIE: Instructional Editing and Reasoning Video Concepts with Grounded Generation

要約 最近のビデオ拡散モデルはビデオ編集を強化していますが、統一されたフレームワ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | VEGGIE: Instructional Editing and Reasoning Video Concepts with Grounded Generation はコメントを受け付けていません

Retrospective: A CORDIC Based Configurable Activation Function for NN Applications

要約 機能的な再構成性を提供することにより、リソース制約システムのASICハード … 続きを読む

カテゴリー: cs.AI, cs.AR, cs.CV, cs.ET, eess.IV | Retrospective: A CORDIC Based Configurable Activation Function for NN Applications はコメントを受け付けていません

MAST-Pro: Dynamic Mixture-of-Experts for Adaptive Segmentation of Pan-Tumors with Knowledge-Driven Prompts

要約 がんの診断と治療には、正確な腫瘍のセグメンテーションが重要です。 基礎モデ … 続きを読む

カテゴリー: cs.CV | MAST-Pro: Dynamic Mixture-of-Experts for Adaptive Segmentation of Pan-Tumors with Knowledge-Driven Prompts はコメントを受け付けていません

RFMI: Estimating Mutual Information on Rectified Flow for Text-to-Image Alignment

要約 フローマッチングフレームワークでトレーニングされた修正フロー(RF)モデル … 続きを読む

カテゴリー: cs.CV, cs.LG | RFMI: Estimating Mutual Information on Rectified Flow for Text-to-Image Alignment はコメントを受け付けていません

ImViD: Immersive Volumetric Videos for Enhanced VR Engagement

要約 ユーザーエンゲージメントは、視覚刺激と聴覚刺激を組み合わせた完全に没入型の … 続きを読む

カテゴリー: cs.CV | ImViD: Immersive Volumetric Videos for Enhanced VR Engagement はコメントを受け付けていません

The Shape of Attraction in UMAP: Exploring the Embedding Forces in Dimensionality Reduction

要約 均一なマニホールド近似と投影(UMAP)は、最も人気のあるネイバーの埋め込 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | The Shape of Attraction in UMAP: Exploring the Embedding Forces in Dimensionality Reduction はコメントを受け付けていません

Targeted Neural Architectures in Multi-Objective Frameworks for Complete Glioma Characterization from Multimodal MRI

要約 脳腫瘍は、脳組織の異常な細胞増殖に起因します。 診断されていない場合、それ … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV, I.4.6 | Targeted Neural Architectures in Multi-Objective Frameworks for Complete Glioma Characterization from Multimodal MRI はコメントを受け付けていません

CaReBench: A Fine-Grained Benchmark for Video Captioning and Retrieval

要約 ビデオキャプションや検索を含むビデオの理解は、ビデオ言語モデル(VLM)に … 続きを読む

カテゴリー: cs.CV, cs.IR, cs.LG | CaReBench: A Fine-Grained Benchmark for Video Captioning and Retrieval はコメントを受け付けていません