-
最近の投稿
- CarbonFish — A Bistable Underactuated Compliant Fish Robot capable of High Frequency Undulation
- MoVEInt: Mixture of Variational Experts for Learning Human-Robot Interactions from Demonstrations
- Make the Pertinent Salient: Task-Relevant Reconstruction for Visual Control with Distractions
- REPeat: A Real2Sim2Real Approach for Pre-acquisition of Soft Food Items in Robot-assisted Feeding
- Input-to-State Stable Coupled Oscillator Networks for Closed-form Model-based Control in Latent Space
-
最近のコメント
表示できるコメントはありません。 cs.AI (28061) cs.CL (21198) cs.CR (2193) cs.CV (34733) cs.LG (32791) cs.RO (16124) cs.SY (2493) eess.IV (4241) eess.SY (2487) stat.ML (4395)
「cs.CV」カテゴリーアーカイブ
Evaluating Multiview Object Consistency in Humans and Image Models
要約 3D 形状推論タスクにおける人間の観察者と視覚モデルの間の整合性を直接評価 … 続きを読む
カテゴリー: cs.CV
Evaluating Multiview Object Consistency in Humans and Image Models はコメントを受け付けていません
Green Screen Augmentation Enables Scene Generalisation in Robotic Manipulation
要約 ビジョンベースの操作ポリシーを新しい環境に一般化することは、依然として困難 … 続きを読む
Neural Surface Reconstruction and Rendering for LiDAR-Visual Systems
要約 この論文では、神経放射フィールド (NeRF) とニューラル ディスタンス … 続きを読む
From Words to Poses: Enhancing Novel Object Pose Estimation with Vision Language Models
要約 ロボットは、新しい状況に継続的に適応する必要がある現実世界のシナリオで対話 … 続きを読む
OAFuser: Towards Omni-Aperture Fusion for Light Field Semantic Segmentation
要約 ライトフィールドカメラは、複雑な角度および空間の詳細を捉えることができます … 続きを読む
Concept Conductor: Orchestrating Multiple Personalized Concepts in Text-to-Image Synthesis
要約 テキストから画像へのモデルのカスタマイズは大幅に進歩しましたが、複数のパー … 続きを読む
Seeing Through the Mask: Rethinking Adversarial Examples for CAPTCHAs
要約 最新の CAPTCHA は、コンピュータにとっては難しくても人間にとっては … 続きを読む
CMMMU: A Chinese Massive Multi-discipline Multimodal Understanding Benchmark
要約 大規模マルチモーダル モデル (LMM) の機能が進化し続けるにつれて、L … 続きを読む
LEROjD: Lidar Extended Radar-Only Object Detection
要約 自動運転には正確な 3D オブジェクト検出が不可欠です。 LIDAR セン … 続きを読む
Latent 3D Brain MRI Counterfactual
要約 構造的脳 MRI 研究のサンプル数は、深層学習モデルを適切にトレーニングす … 続きを読む