「cs.CV」カテゴリーアーカイブ

UnCommon Objects in 3D

投稿日: 2025年1月14日作成者: jarxiv

要約 3D ディープラーニングと 3D 生成 AI 用の新しいオブジェクト中心 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.GR | コメントを受け付けていません

Dataset Distillation via Committee Voting

投稿日: 2025年1月14日作成者: jarxiv

要約データセットの蒸留は、元のデータの重要な特性を保持する、より小さく代表的な … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Class Distance Weighted Cross Entropy Loss for Classification of Disease Severity

投稿日: 2025年1月14日作成者: jarxiv

要約各クラスが増加する重症度レベルを反映する順序クラスを使用して疾患の重症度を … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Migician: Revealing the Magic of Free-Form Multi-Image Grounding in Multimodal Large Language Models

投稿日: 2025年1月14日作成者: jarxiv

要約マルチモーダル大規模言語モデル (MLLM) の最近の進歩により、単一画像 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

AI-Driven Diabetic Retinopathy Screening: Multicentric Validation of AIDRSS in India

投稿日: 2025年1月14日作成者: jarxiv

要約目的: 糖尿病性網膜症 (DR) は、特にインドにおいては視力喪失の主な原 … 続きを読む →

カテゴリー: cs.AI, cs.CV, eess.IV | コメントを受け付けていません

eKalibr: Dynamic Intrinsic Calibration for Event Cameras From First Principles of Events

投稿日: 2025年1月13日作成者: jarxiv

要約生物からインスピレーションを得たイベントカメラは、その高ダイナミックレンジ … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Semantic Mapping in Indoor Embodied AI — A Comprehensive Survey and Future Directions

投稿日: 2025年1月13日作成者: jarxiv

要約インテリジェントな身体化エージェント (ロボットなど) は、不慣れな環境で … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Overcoming Language Priors for Visual Question Answering Based on Knowledge Distillation

投稿日: 2025年1月13日作成者: jarxiv

要約これまでの研究では、ビジュアル質問応答 (VQA) モデルは、回答の予測に … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Towards Automatic Evaluation for Image Transcreation

投稿日: 2025年1月13日作成者: jarxiv

要約音声やテキストを翻訳するという従来のパラダイムを超えて、最近では、異なる文 … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Migician: Revealing the Magic of Free-Form Multi-Image Grounding in Multimodal Large Language Models

投稿日: 2025年1月13日作成者: jarxiv

要約マルチモーダル大規模言語モデル (MLLM) の最近の進歩により、単一画像 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

UnCommon Objects in 3D

Dataset Distillation via Committee Voting

Class Distance Weighted Cross Entropy Loss for Classification of Disease Severity

Migician: Revealing the Magic of Free-Form Multi-Image Grounding in Multimodal Large Language Models

AI-Driven Diabetic Retinopathy Screening: Multicentric Validation of AIDRSS in India

eKalibr: Dynamic Intrinsic Calibration for Event Cameras From First Principles of Events

Semantic Mapping in Indoor Embodied AI — A Comprehensive Survey and Future Directions

Overcoming Language Priors for Visual Question Answering Based on Knowledge Distillation

Towards Automatic Evaluation for Image Transcreation

Migician: Revealing the Magic of Free-Form Multi-Image Grounding in Multimodal Large Language Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー