-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
UnCommon Objects in 3D
要約 3D ディープ ラーニングと 3D 生成 AI 用の新しいオブジェクト中心 … 続きを読む
Dataset Distillation via Committee Voting
要約 データセットの蒸留は、元のデータの重要な特性を保持する、より小さく代表的な … 続きを読む
Class Distance Weighted Cross Entropy Loss for Classification of Disease Severity
要約 各クラスが増加する重症度レベルを反映する順序クラスを使用して疾患の重症度を … 続きを読む
カテゴリー: cs.CV
Class Distance Weighted Cross Entropy Loss for Classification of Disease Severity はコメントを受け付けていません
Migician: Revealing the Magic of Free-Form Multi-Image Grounding in Multimodal Large Language Models
要約 マルチモーダル大規模言語モデル (MLLM) の最近の進歩により、単一画像 … 続きを読む
AI-Driven Diabetic Retinopathy Screening: Multicentric Validation of AIDRSS in India
要約 目的: 糖尿病性網膜症 (DR) は、特にインドにおいては視力喪失の主な原 … 続きを読む
eKalibr: Dynamic Intrinsic Calibration for Event Cameras From First Principles of Events
要約 生物からインスピレーションを得たイベントカメラは、その高ダイナミックレンジ … 続きを読む
Semantic Mapping in Indoor Embodied AI — A Comprehensive Survey and Future Directions
要約 インテリジェントな身体化エージェント (ロボットなど) は、不慣れな環境で … 続きを読む
Overcoming Language Priors for Visual Question Answering Based on Knowledge Distillation
要約 これまでの研究では、ビジュアル質問応答 (VQA) モデルは、回答の予測に … 続きを読む
Towards Automatic Evaluation for Image Transcreation
要約 音声やテキストを翻訳するという従来のパラダイムを超えて、最近では、異なる文 … 続きを読む
Migician: Revealing the Magic of Free-Form Multi-Image Grounding in Multimodal Large Language Models
要約 マルチモーダル大規模言語モデル (MLLM) の最近の進歩により、単一画像 … 続きを読む