-
最近の投稿
- Open-Vocabulary Action Localization with Iterative Visual Prompting
- Patterned Structure Muscle : Arbitrary Shaped Wire-driven Artificial Muscle Utilizing Anisotropic Flexible Structure for Musculoskeletal Robots
- The Power of Input: Benchmarking Zero-Shot Sim-To-Real Transfer of Reinforcement Learning Control Policies for Quadrotor Control
- PokeFlex: A Real-World Dataset of Deformable Objects for Robotics
- Toward a Better Understanding of Robot Energy Consumption in Agroecological Applications
-
最近のコメント
表示できるコメントはありません。 cs.AI (27918) cs.CL (21095) cs.CR (2183) cs.CV (34618) cs.LG (32650) cs.RO (16022) cs.SY (2484) eess.IV (4238) eess.SY (2478) stat.ML (4372)
月別アーカイブ: 2024年4月
TOP-Nav: Legged Navigation Integrating Terrain, Obstacle and Proprioception Estimation
要約 脚式ナビゲーションは通常、オープンワールド、オフロード、および困難な環境内 … 続きを読む
FlowMap: High-Quality Camera Poses, Intrinsics, and Depth via Gradient Descent
要約 このペーパーでは、ビデオ シーケンスの正確なカメラ ポーズ、カメラ固有の要 … 続きを読む
カテゴリー: cs.CV
FlowMap: High-Quality Camera Poses, Intrinsics, and Depth via Gradient Descent はコメントを受け付けていません
Multi-Session SLAM with Differentiable Wide-Baseline Pose Optimization
要約 マルチセッション SLAM の新しいシステムを導入します。これは、単一のグ … 続きを読む
カテゴリー: cs.CV
Multi-Session SLAM with Differentiable Wide-Baseline Pose Optimization はコメントを受け付けていません
TalkingGaussian: Structure-Persistent 3D Talking Head Synthesis via Gaussian Splatting
要約 ラディアンス フィールドは、本物のような 3D トーキング ヘッドの合成に … 続きを読む
カテゴリー: cs.CV
TalkingGaussian: Structure-Persistent 3D Talking Head Synthesis via Gaussian Splatting はコメントを受け付けていません
VideoXum: Cross-modal Visual and Textural Summarization of Videos
要約 ビデオの要約は、ソースビデオから最も重要な情報を抽出して、要約されたクリッ … 続きを読む
From Parts to Whole: A Unified Reference Framework for Controllable Human Image Generation
要約 制御可能な人物画像生成の最近の進歩により、構造信号 (ポーズ、奥行きなど) … 続きを読む
カテゴリー: cs.CV
From Parts to Whole: A Unified Reference Framework for Controllable Human Image Generation はコメントを受け付けていません
Automatic Layout Planning for Visually-Rich Documents with Instruction-Following Models
要約 命令追従モデルの最近の進歩により、ユーザーとモデルの対話がよりユーザーフレ … 続きを読む
CT-GLIP: 3D Grounded Language-Image Pretraining with CT Scans and Radiology Reports for Full-Body Scenarios
要約 Medical Vision-Language Pretraining ( … 続きを読む
Metric-guided Image Reconstruction Bounds via Conformal Prediction
要約 最近の機械学習の進歩により、不適切な問題に対処する新しいイメージング シス … 続きを読む
カテゴリー: cs.CV, cs.LG, eess.IV, physics.med-ph
Metric-guided Image Reconstruction Bounds via Conformal Prediction はコメントを受け付けていません
Weakly Supervised 3D Object Detection via Multi-Level Visual Guidance
要約 弱教師付き 3D オブジェクト検出は、2D ラベルなど、より低いアノテーシ … 続きを読む
カテゴリー: cs.CV
Weakly Supervised 3D Object Detection via Multi-Level Visual Guidance はコメントを受け付けていません