-
最近の投稿
- 3D Water Quality Mapping using Invariant Extended Kalman Filtering for Underwater Robot Localization
- Hybrid Visual Servoing of Tendon-driven Continuum Robots
- Embodying Control in Soft Multistable Grippers from morphofunctional co-design
- View-Invariant Policy Learning via Zero-Shot Novel View Synthesis
- ModSkill: Physical Character Skill Modularization
-
最近のコメント
表示できるコメントはありません。 cs.AI (34028) cs.CL (25726) cs.CR (2616) cs.CV (39965) cs.LG (39031) cs.RO (19850) cs.SY (3019) eess.IV (4757) eess.SY (3013) stat.ML (5150)
月別アーカイブ: 2024年6月
Enhancing Video-Language Representations with Structural Spatio-Temporal Alignment
要約 大規模なビデオ言語モデル (VLM) の事前トレーニングは、さまざまなダウ … 続きを読む
Shortcut Learning in Medical Image Segmentation
要約 ショートカット学習とは、機械学習モデルが、トレーニング セットを超えて一般 … 続きを読む
Read Anywhere Pointed: Layout-aware GUI Screen Reading with Tree-of-Lens Grounding
要約 グラフィカル ユーザー インターフェイス (GUI) は、デジタル デバイ … 続きを読む
Muffin or Chihuahua? Challenging Multimodal Large Language Models with Multipanel VQA
要約 Web スクリーンショットやポスターなどとして一般的に見られるマルチパネル … 続きを読む
HuatuoGPT-Vision, Towards Injecting Medical Visual Knowledge into Multimodal LLMs at Scale
要約 GPT-4V などのマルチモーダル大規模言語モデル (MLLM) の急速な … 続きを読む
Human Modelling and Pose Estimation Overview
要約 人間のモデリングと姿勢推定は、コンピューター ビジョン、コンピューター グ … 続きを読む
Enhancing Continual Learning in Visual Question Answering with Modality-Aware Feature Distillation
要約 継続的学習は、以前のタスクのパフォーマンス低下を最小限に抑えながら新しいタ … 続きを読む
カテゴリー: cs.CV
Enhancing Continual Learning in Visual Question Answering with Modality-Aware Feature Distillation はコメントを受け付けていません
Compositional Image Decomposition with Diffusion Models
要約 自然のシーンの画像が与えられると、それをオブジェクト、照明、影、前景などの … 続きを読む
PNeRV: A Polynomial Neural Representation for Videos
要約 ビデオ データ上の Implicit Neural Representat … 続きを読む
カテゴリー: cs.CV
PNeRV: A Polynomial Neural Representation for Videos はコメントを受け付けていません
Mapping Land Naturalness from Sentinel-2 using Deep Contextual and Geographical Priors
要約 ここ数十年で、気候変動の原因と結果は加速し、前例のない規模で地球に影響を与 … 続きを読む