-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2023年2月
Visual Spatial Reasoning
要約 空間関係は、人間の認知の基本的な部分です。 ただし、それらはさまざまな方法 … 続きを読む
Is This Loss Informative? Speeding Up Textual Inversion with Deterministic Objective Evaluation
要約 テキストから画像への生成モデルは、画像合成における進化の次のステップを表し … 続きを読む
Robot Synesthesia: A Sound and Emotion Guided AI Painter
要約 絵が千の言葉を描くなら、音は百万の言葉を発するかもしれません。 最近のロボ … 続きを読む
カテゴリー: cs.CV
Robot Synesthesia: A Sound and Emotion Guided AI Painter はコメントを受け付けていません
Trading Information between Latents in Hierarchical Variational Autoencoders
要約 Variational Autoencoders (VAE) は、もともと … 続きを読む
One-shot Visual Imitation via Attributed Waypoints and Demonstration Augmentation
要約 この論文では、既存の手法の動作を分析し、ワンショットの視覚的模倣の問題に対 … 続きを読む
Re-ViLM: Retrieval-Augmented Visual Language Model for Zero and Few-Shot Image Captioning
要約 ビジョン エンコーダー (Flamingo など) を使用して事前トレーニ … 続きを読む
Diverse Human Motion Prediction Guided by Multi-Level Spatial-Temporal Anchors
要約 一連の歴史的なポーズから与えられた多様な人間の動きを予測することは、ますま … 続きを読む
カテゴリー: cs.CV
Diverse Human Motion Prediction Guided by Multi-Level Spatial-Temporal Anchors はコメントを受け付けていません
Polynomial Neural Fields for Subband Decomposition and Manipulation
要約 ニューラル フィールドは、信号を表現するための新しいパラダイムとして登場し … 続きを読む
Learning by Asking for Embodied Visual Navigation and Task Completion
要約 研究コミュニティは、人間がタスクを遂行するのを支援できるインテリジェントな … 続きを読む
UniPC: A Unified Predictor-Corrector Framework for Fast Sampling of Diffusion Models
要約 拡散確率モデル (DPM) は、高解像度の画像合成において非常に有望な能力 … 続きを読む