-
最近の投稿
- Open-Vocabulary Action Localization with Iterative Visual Prompting
- Patterned Structure Muscle : Arbitrary Shaped Wire-driven Artificial Muscle Utilizing Anisotropic Flexible Structure for Musculoskeletal Robots
- The Power of Input: Benchmarking Zero-Shot Sim-To-Real Transfer of Reinforcement Learning Control Policies for Quadrotor Control
- PokeFlex: A Real-World Dataset of Deformable Objects for Robotics
- Toward a Better Understanding of Robot Energy Consumption in Agroecological Applications
-
最近のコメント
表示できるコメントはありません。 cs.AI (27918) cs.CL (21095) cs.CR (2183) cs.CV (34618) cs.LG (32650) cs.RO (16022) cs.SY (2484) eess.IV (4238) eess.SY (2478) stat.ML (4372)
月別アーカイブ: 2024年5月
WorDepth: Variational Language Prior for Monocular Depth Estimation
要約 単一の画像からの 3 次元 (3D) 再構成は、スケールなどの固有の曖昧さ … 続きを読む
Trackastra: Transformer-based cell tracking for live-cell microscopy
要約 細胞追跡は、生細胞顕微鏡法において遍在する画像解析タスクです。 これは複数 … 続きを読む
カテゴリー: cs.CV
Trackastra: Transformer-based cell tracking for live-cell microscopy はコメントを受け付けていません
Hierarchical Uncertainty Exploration via Feedforward Posterior Trees
要約 不適切な逆設定の逆問題を解くとき、単一のもっともらしい再構成が提示されるよ … 続きを読む
Disease-informed Adaptation of Vision-Language Models
要約 医療画像分析では、専門知識の不足とデータ注釈のコストが高いため、大規模な人 … 続きを読む
カテゴリー: cs.CV
Disease-informed Adaptation of Vision-Language Models はコメントを受け付けていません
Score identity Distillation: Exponentially Fast Distillation of Pretrained Diffusion Models for One-Step Generation
要約 スコア同一性蒸留 (SiD) を導入します。これは、事前トレーニングされた … 続きを読む
LM4LV: A Frozen Large Language Model for Low-level Vision Tasks
要約 大規模言語モデル (LLM) の成功により、マルチモダリティ大規模言語モデ … 続きを読む
カテゴリー: cs.CV
LM4LV: A Frozen Large Language Model for Low-level Vision Tasks はコメントを受け付けていません
Multi-Track Timeline Control for Text-Driven 3D Human Motion Generation
要約 最近の生成モデリングの進歩により、短いプロンプトと指定された長さからキャラ … 続きを読む
ConvLLaVA: Hierarchical Backbones as Visual Encoder for Large Multimodal Models
要約 高解像度の大規模マルチモーダル モデル (LMM) は、過剰なビジュアル … 続きを読む
カテゴリー: cs.CV
ConvLLaVA: Hierarchical Backbones as Visual Encoder for Large Multimodal Models はコメントを受け付けていません
Hierarchical NeuroSymbolic Approach for Comprehensive and Explainable Action Quality Assessment
要約 アクション品質評価 (AQA) は、コンピューター ビジョンを応用して人間 … 続きを読む
ETTrack: Enhanced Temporal Motion Predictor for Multi-Object Tracking
要約 多くのマルチオブジェクト追跡 (MOT) アプローチは、モーション情報を利 … 続きを読む
カテゴリー: cs.CV
ETTrack: Enhanced Temporal Motion Predictor for Multi-Object Tracking はコメントを受け付けていません