-
最近の投稿
- On the Feedback Law in Stochastic Optimal Nonlinear Control
- Open-Vocabulary Action Localization with Iterative Visual Prompting
- Patterned Structure Muscle : Arbitrary Shaped Wire-driven Artificial Muscle Utilizing Anisotropic Flexible Structure for Musculoskeletal Robots
- The Power of Input: Benchmarking Zero-Shot Sim-To-Real Transfer of Reinforcement Learning Control Policies for Quadrotor Control
- PokeFlex: A Real-World Dataset of Deformable Objects for Robotics
-
最近のコメント
表示できるコメントはありません。 cs.AI (27918) cs.CL (21095) cs.CR (2183) cs.CV (34618) cs.LG (32650) cs.RO (16023) cs.SY (2485) eess.IV (4238) eess.SY (2479) stat.ML (4372)
「cs.CV」カテゴリーアーカイブ
Enhancing Canine Musculoskeletal Diagnoses: Leveraging Synthetic Image Data for Pre-Training AI-Models on Visual Documentations
要約 犬の筋骨格系の検査は、獣医の現場において困難な課題です。 この研究では、視 … 続きを読む
カテゴリー: cs.CV
Enhancing Canine Musculoskeletal Diagnoses: Leveraging Synthetic Image Data for Pre-Training AI-Models on Visual Documentations はコメントを受け付けていません
Gaussian Garments: Reconstructing Simulation-Ready Clothing with Photorealistic Appearance from Multi-View Video
要約 マルチビュー ビデオからリアルなシミュレーション対応の衣服アセットを再構築 … 続きを読む
DINOv2 Rocks Geological Image Analysis: Classification, Segmentation, and Interpretability
要約 コンピューター ビジョンの最近の進歩により、画像分析タスクが大幅に改善され … 続きを読む
カテゴリー: cs.CV, physics.geo-ph
DINOv2 Rocks Geological Image Analysis: Classification, Segmentation, and Interpretability はコメントを受け付けていません
What Makes a Maze Look Like a Maze?
要約 人間の視覚的理解のユニークな側面は、抽象的な概念を柔軟に解釈する能力です。 … 続きを読む
ComAlign: Compositional Alignment in Vision-Language Models
要約 CLIP のようなビジョン言語モデル (VLM) は、下流のタスクに転送可 … 続きを読む
VI3DRM:Towards meticulous 3D Reconstruction from Sparse Views via Photo-Realistic Novel View Synthesis
要約 最近では、Zero-1-2-3 のような手法が単一ビュー ベースの 3D … 続きを読む
カテゴリー: cs.CV
VI3DRM:Towards meticulous 3D Reconstruction from Sparse Views via Photo-Realistic Novel View Synthesis はコメントを受け付けていません
LT3SD: Latent Trees for 3D Scene Diffusion
要約 我々は、大規模な 3D シーン生成のための新しい潜在拡散モデル LT3SD … 続きを読む
What Makes a Face Look like a Hat: Decoupling Low-level and High-level Visual Properties with Image Triplets
要約 視覚的な意思決定では、オブジェクト カテゴリなどの高レベルの機能が選択に大 … 続きを読む
Model Ensemble for Brain Tumor Segmentation in Magnetic Resonance Imaging
要約 マルチパラメトリック磁気共鳴画像法で脳腫瘍をセグメント化することにより、臨 … 続きを読む
IFAdapter: Instance Feature Control for Grounded Text-to-Image Generation
要約 Text-to-Image (T2I) 拡散モデルは、個々のインスタンスの … 続きを読む