-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
On the Importance of Text Preprocessing for Multimodal Representation Learning and Pathology Report Generation
要約 病理学のビジョン言語モデルにより、マルチモーダルケースの検索と自動レポート … 続きを読む
カテゴリー: cs.CV
On the Importance of Text Preprocessing for Multimodal Representation Learning and Pathology Report Generation はコメントを受け付けていません
GHOST 2.0: generative high-fidelity one shot transfer of heads
要約 フェイススワッピングのタスクは最近、研究コミュニティで注目を集めていますが … 続きを読む
カテゴリー: cs.CV
GHOST 2.0: generative high-fidelity one shot transfer of heads はコメントを受け付けていません
Pathology Report Generation and Multimodal Representation Learning for Cutaneous Melanocytic Lesions
要約 数百万のメラニン細胞皮膚病変が毎年病理学者によって検査されていますが、その … 続きを読む
カテゴリー: cs.CV
Pathology Report Generation and Multimodal Representation Learning for Cutaneous Melanocytic Lesions はコメントを受け付けていません
RetinaRegen: A Hybrid Model for Readability and Detail Restoration in Fundus Images
要約 眼底の画質は眼疾患を診断するために重要ですが、実際の状態はしばしばぼやけた … 続きを読む
Autonomous Vision-Guided Resection of Central Airway Obstruction
要約 既存の気管腫瘍切除法は、効果的な気道クリアランスに必要な精度が欠けているこ … 続きを読む
QueryAdapter: Rapid Adaptation of Vision-Language Models in Response to Natural Language Queries
要約 視覚言語モデル(VLM)のトレーニングに使用される大規模なインターネットデ … 続きを読む
MaskPlanner: Learning-Based Object-Centric Motion Generation from 3D Point Clouds
要約 オブジェクト中心のモーション生成(OCMG)は、ロボットスプレー塗装や溶接 … 続きを読む
Attention-Guided Integration of CLIP and SAM for Precise Object Masking in Robotic Manipulation
要約 このペーパーでは、コンビニエンスストアのマスキング製品の特定のドメイン内で … 続きを読む
Ground-level Viewpoint Vision-and-Language Navigation in Continuous Environments
要約 Vision-and-Language Navigation(VLN)は、 … 続きを読む
SteeredMarigold: Steering Diffusion Towards Depth Completion of Largely Incomplete Depth Maps
要約 実際の環境で展開されたRGB-Dセンサーによってキャプチャされた深度マップ … 続きを読む