cs.CV」カテゴリーアーカイブ

Exploring the Effectiveness of Object-Centric Representations in Visual Question Answering: Comparative Insights with Foundation Models

要約 離散オブジェクトの構成として視覚シーンをモデル化するオブジェクト中心(OC … 続きを読む

カテゴリー: cs.CV, cs.LG | コメントする

Language-Informed Hyperspectral Image Synthesis for Imbalanced-Small Sample Classification via Semi-Supervised Conditional Diffusion Model

要約 データ増強は、ハイパースペクトル画像分類(HSIC)の不均衡なスマルサンプ … 続きを読む

カテゴリー: cs.CV | コメントする

Foundation Models — A Panacea for Artificial Intelligence in Pathology?

要約 病理学における人工知能(AI)の役割は、診断を支援することから、全体のスラ … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

Adaptive Keyframe Sampling for Long Video Understanding

要約 マルチモーダル大手言語モデル(MLLM)は、視覚入力をコンテキストとして大 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | コメントする

Back to the Future Cyclopean Stereo: a human perception approach unifying deep and geometric constraints

要約 深さの不連続性と閉塞を組み込んだシクロピアンアイモデルで見られるように、分 … 続きを読む

カテゴリー: cs.CV | コメントする

Efficient and Context-Aware Label Propagation for Zero-/Few-Shot Training-Free Adaptation of Vision-Language Model

要約 ビジョン言語モデル(VLM)は、さまざまな下流タスクに取り組むために、大規 … 続きを読む

カテゴリー: cs.CV | コメントする

MIGE: A Unified Framework for Multimodal Instruction-Based Image Generation and Editing

要約 拡散ベースの画像生成の大幅な進歩にもかかわらず、被験者主導の生成と命令ベー … 続きを読む

カテゴリー: cs.CV | コメントする

AutoComb: Automated Comb Sign Detector for 3D CTE Scans

要約 コームサインは、複数の胃腸疾患を検出するための重要なイメージングバイオマー … 続きを読む

カテゴリー: cs.CV, eess.IV | コメントする

DELTA: Dense Efficient Long-range 3D Tracking for any video

要約 特に長いシーケンスにわたるピクセルレベルの精度を目指している場合、単眼ビデ … 続きを読む

カテゴリー: cs.CV | コメントする

Unsupervised Parameter Efficient Source-free Post-pretraining

要約 NLPでの成功に続いて、最高のビジョンモデルは現在、10億パラメーターの範 … 続きを読む

カテゴリー: cs.CV, cs.LG | コメントする