月別アーカイブ: 2024年4月

Advanced wood species identification based on multiple anatomical sections and using deep feature transfer and fusion

要約 近年、木材種の識別において多くの進歩が見られます。 DNA 分析、近赤外 … 続きを読む

カテゴリー: cs.CV | Advanced wood species identification based on multiple anatomical sections and using deep feature transfer and fusion はコメントを受け付けていません

Enhancing Visual Question Answering through Question-Driven Image Captions as Prompts

要約 ビジュアル質問応答 (VQA) は、ビジョンと言語の内容についての理解、推 … 続きを読む

カテゴリー: cs.AI, cs.CV | Enhancing Visual Question Answering through Question-Driven Image Captions as Prompts はコメントを受け付けていません

ProbMCL: Simple Probabilistic Contrastive Learning for Multi-label Visual Classification

要約 マルチラベル画像分類は、コンピューター ビジョンや医療画像処理など、多くの … 続きを読む

カテゴリー: cs.CV, cs.LG | ProbMCL: Simple Probabilistic Contrastive Learning for Multi-label Visual Classification はコメントを受け付けていません

Improving Referring Image Segmentation using Vision-Aware Text Features

要約 画像セグメンテーションの参照は、自然言語記述に基づいてピクセル単位のセグメ … 続きを読む

カテゴリー: cs.AI, cs.CV | Improving Referring Image Segmentation using Vision-Aware Text Features はコメントを受け付けていません

WonderJourney: Going from Anywhere to Everywhere

要約 永続的な 3D シーン生成のためのモジュール化されたフレームワークである … 続きを読む

カテゴリー: cs.CV, cs.GR | WonderJourney: Going from Anywhere to Everywhere はコメントを受け付けていません

PromptSync: Bridging Domain Gaps in Vision-Language Models through Class-Aware Prototype Alignment and Discrimination

要約 CLIP などのビジョン言語 (V-L) モデルのゼロショット一般化の可能 … 続きを読む

カテゴリー: cs.CL, cs.CV | PromptSync: Bridging Domain Gaps in Vision-Language Models through Class-Aware Prototype Alignment and Discrimination はコメントを受け付けていません

Training-free Boost for Open-Vocabulary Object Detection with Confidence Aggregation

要約 オープン語彙オブジェクト検出 (OVOD) は、トレーニング時には表示され … 続きを読む

カテゴリー: cs.CV | Training-free Boost for Open-Vocabulary Object Detection with Confidence Aggregation はコメントを受け付けていません

FloCoDe: Unbiased Dynamic Scene Graph Generation with Temporal Consistency and Correlation Debiasing

要約 ビデオからの動的シーン グラフ生成 (SGG) には、シーン全体のオブジェ … 続きを読む

カテゴリー: cs.CV | FloCoDe: Unbiased Dynamic Scene Graph Generation with Temporal Consistency and Correlation Debiasing はコメントを受け付けていません

Automatic Quantification of Serial PET/CT Images for Pediatric Hodgkin Lymphoma Patients Using a Longitudinally-Aware Segmentation Network

要約 $\textbf{目的}$: 中間治療スキャンにおける残存病変は多くの場合 … 続きを読む

カテゴリー: cs.AI, cs.CV, physics.med-ph | Automatic Quantification of Serial PET/CT Images for Pediatric Hodgkin Lymphoma Patients Using a Longitudinally-Aware Segmentation Network はコメントを受け付けていません

LLaVA-PruMerge: Adaptive Token Reduction for Efficient Large Multimodal Models

要約 大規模マルチモーダル モデル (LMM) は、ビジュアル エンコーダーと大 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | LLaVA-PruMerge: Adaptive Token Reduction for Efficient Large Multimodal Models はコメントを受け付けていません