-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年2月
NeRF Analogies: Example-Based Visual Attribute Transfer for NeRFs
要約 Neural Radiance Field (NeRF) は、3D ジオメ … 続きを読む
カテゴリー: cs.CV
NeRF Analogies: Example-Based Visual Attribute Transfer for NeRFs はコメントを受け付けていません
Vision-Language Models Provide Promptable Representations for Reinforcement Learning
要約 人間は背景世界の知識を活用することで、新しい行動を素早く学習できます。 対 … 続きを読む
BdSLW60: A Word-Level Bangla Sign Language Dataset
要約 手話による会話は、聴覚障害者にとって日常のコミュニケーションに不可欠な手段 … 続きを読む
カテゴリー: cs.CV
BdSLW60: A Word-Level Bangla Sign Language Dataset はコメントを受け付けていません
Learned Image Compression with Text Quality Enhancement
要約 学習された画像圧縮は、超低ビットレートを効率的に達成できるため、広く普及し … 続きを読む
Peeking Behind the Curtains of Residual Learning
要約 残差学習の利用は、深くてスケーラブルなニューラル ネットワークで広く普及し … 続きを読む
Learning Continuous 3D Words for Text-to-Image Generation
要約 画像生成のための拡散モデルに対する現在の制御(テキストや ControlN … 続きを読む
カテゴリー: cs.CV
Learning Continuous 3D Words for Text-to-Image Generation はコメントを受け付けていません
PIN: Positional Insert Unlocks Object Localisation Abilities in VLMs
要約 Flamingo や GPT-4V などのビジョン言語モデル (VLM) … 続きを読む
カテゴリー: cs.CV
PIN: Positional Insert Unlocks Object Localisation Abilities in VLMs はコメントを受け付けていません
Are Semi-Dense Detector-Free Methods Good at Matching Local Features?
要約 LoFTR などの準高密度検出器を使用しないアプローチ (SDF) は、現 … 続きを読む
Mitigating Object Hallucination in Large Vision-Language Models via Classifier-Free Guidance
要約 Large Vision-Language Model (LVLM) の進 … 続きを読む
IM-3D: Iterative Multiview Diffusion and Reconstruction for High-Quality 3D Generation
要約 ほとんどの text-to-image ジェネレーターは、数十億の画像でト … 続きを読む