cs.CV」カテゴリーアーカイブ

Towards Physically-Based Sky-Modeling

要約 正確な環境マップは、コヒーレントな照明を使用してフォトリアリスティックな屋 … 続きを読む

カテゴリー: cs.CV, eess.IV | Towards Physically-Based Sky-Modeling はコメントを受け付けていません

SegMAN: Omni-scale Context Modeling with State Space Models and Local Attention for Semantic Segmentation

要約 高品質のセマンティック セグメンテーションは、グローバル コンテキスト モ … 続きを読む

カテゴリー: cs.CV | SegMAN: Omni-scale Context Modeling with State Space Models and Local Attention for Semantic Segmentation はコメントを受け付けていません

From 2D CAD Drawings to 3D Parametric Models: A Vision-Language Approach

要約 この論文では、2D CAD 図面から 3D パラメトリック モデルを再構成 … 続きを読む

カテゴリー: cs.CV | From 2D CAD Drawings to 3D Parametric Models: A Vision-Language Approach はコメントを受け付けていません

Exploring Vacant Classes in Label-Skewed Federated Learning

要約 ラベル スキューは、クライアント間でのローカル ラベル分布の不均衡によって … 続きを読む

カテゴリー: cs.CV, cs.LG | Exploring Vacant Classes in Label-Skewed Federated Learning はコメントを受け付けていません

PunchBench: Benchmarking MLLMs in Multimodal Punchline Comprehension

要約 画像とキャプションのペアでユーモアや皮肉を伝えるマルチモーダルなオチは、オ … 続きを読む

カテゴリー: cs.AI, cs.CV | PunchBench: Benchmarking MLLMs in Multimodal Punchline Comprehension はコメントを受け付けていません

Does VLM Classification Benefit from LLM Description Semantics?

要約 画像をテキストで正確に説明することは、説明可能な AI の基礎です。 CL … 続きを読む

カテゴリー: cs.CV | Does VLM Classification Benefit from LLM Description Semantics? はコメントを受け付けていません

IRR: Image Review Ranking Framework for Evaluating Vision-Language Models

要約 大規模ビジョン言語モデル (LVLM) は、画像とテキストの両方を処理し、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | IRR: Image Review Ranking Framework for Evaluating Vision-Language Models はコメントを受け付けていません

Are the Latent Representations of Foundation Models for Pathology Invariant to Rotation?

要約 デジタルパソロジー用の自己教師あり基礎モデルは、H\&E スライ … 続きを読む

カテゴリー: cs.CV, eess.IV | Are the Latent Representations of Foundation Models for Pathology Invariant to Rotation? はコメントを受け付けていません

Coconut Palm Tree Counting on Drone Images with Deep Object Detection and Synthetic Training Data

要約 ドローンは農業を含むさまざまな領域に革命をもたらしました。 深層学習の最近 … 続きを読む

カテゴリー: cs.CV | Coconut Palm Tree Counting on Drone Images with Deep Object Detection and Synthetic Training Data はコメントを受け付けていません

Advancing Comprehensive Aesthetic Insight with Multi-Scale Text-Guided Self-Supervised Learning

要約 画像の美的評価 (IAA) は、画像の美的価値を分析および評価し、そのハイ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Advancing Comprehensive Aesthetic Insight with Multi-Scale Text-Guided Self-Supervised Learning はコメントを受け付けていません