cs.CV」カテゴリーアーカイブ

UnCommon Objects in 3D

要約 3D ディープ ラーニングと 3D 生成 AI 用の新しいオブジェクト中心 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR | UnCommon Objects in 3D はコメントを受け付けていません

Dataset Distillation via Committee Voting

要約 データセットの蒸留は、元のデータの重要な特性を保持する、より小さく代表的な … 続きを読む

カテゴリー: cs.AI, cs.CV | Dataset Distillation via Committee Voting はコメントを受け付けていません

Class Distance Weighted Cross Entropy Loss for Classification of Disease Severity

要約 各クラスが増加する重症度レベルを反映する順序クラスを使用して疾患の重症度を … 続きを読む

カテゴリー: cs.CV | Class Distance Weighted Cross Entropy Loss for Classification of Disease Severity はコメントを受け付けていません

Migician: Revealing the Magic of Free-Form Multi-Image Grounding in Multimodal Large Language Models

要約 マルチモーダル大規模言語モデル (MLLM) の最近の進歩により、単一画像 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Migician: Revealing the Magic of Free-Form Multi-Image Grounding in Multimodal Large Language Models はコメントを受け付けていません

AI-Driven Diabetic Retinopathy Screening: Multicentric Validation of AIDRSS in India

要約 目的: 糖尿病性網膜症 (DR) は、特にインドにおいては視力喪失の主な原 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | AI-Driven Diabetic Retinopathy Screening: Multicentric Validation of AIDRSS in India はコメントを受け付けていません

eKalibr: Dynamic Intrinsic Calibration for Event Cameras From First Principles of Events

要約 生物からインスピレーションを得たイベントカメラは、その高ダイナミックレンジ … 続きを読む

カテゴリー: cs.CV, cs.RO | eKalibr: Dynamic Intrinsic Calibration for Event Cameras From First Principles of Events はコメントを受け付けていません

Semantic Mapping in Indoor Embodied AI — A Comprehensive Survey and Future Directions

要約 インテリジェントな身体化エージェント (ロボットなど) は、不慣れな環境で … 続きを読む

カテゴリー: cs.CV, cs.RO | Semantic Mapping in Indoor Embodied AI — A Comprehensive Survey and Future Directions はコメントを受け付けていません

Overcoming Language Priors for Visual Question Answering Based on Knowledge Distillation

要約 これまでの研究では、ビジュアル質問応答 (VQA) モデルは、回答の予測に … 続きを読む

カテゴリー: cs.CL, cs.CV | Overcoming Language Priors for Visual Question Answering Based on Knowledge Distillation はコメントを受け付けていません

Towards Automatic Evaluation for Image Transcreation

要約 音声やテキストを翻訳するという従来のパラダイムを超えて、最近では、異なる文 … 続きを読む

カテゴリー: cs.CL, cs.CV | Towards Automatic Evaluation for Image Transcreation はコメントを受け付けていません

Migician: Revealing the Magic of Free-Form Multi-Image Grounding in Multimodal Large Language Models

要約 マルチモーダル大規模言語モデル (MLLM) の最近の進歩により、単一画像 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Migician: Revealing the Magic of Free-Form Multi-Image Grounding in Multimodal Large Language Models はコメントを受け付けていません