-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Imperative Learning: A Self-supervised Neural-Symbolic Learning Framework for Robot Autonomy
要約 強化学習や模倣学習などのデータ駆動型の手法は、ロボットの自律性において目覚 … 続きを読む
Leveraging LLMs for Enhanced Open-Vocabulary 3D Scene Understanding in Autonomous Driving
要約 この論文では、言語埋め込み 3D ガウシアンと大規模言語モデル (LLM) … 続きを読む
VPOcc: Exploiting Vanishing Point for Monocular 3D Semantic Occupancy Prediction
要約 単眼 3D セマンティック占有予測は、単一の RGB カメラを使用するコン … 続きを読む
IG-SLAM: Instant Gaussian SLAM
要約 3D ガウス スプラッティングは、SLAM システムにおけるニューラル暗黙 … 続きを読む
Unleashing the Power of Data Tsunami: A Comprehensive Survey on Data Assessment and Selection for Instruction Tuning of Language Models
要約 命令チューニングは、大規模言語モデル (LLM) を人間の好みに合わせる上 … 続きを読む
Unlocking Exocentric Video-Language Data for Egocentric Video Representation Learning
要約 我々は、自己中心的なビデオ表現学習のためにエキソセントリックなビデオ言語デ … 続きを読む
Teach CLIP to Develop a Number Sense for Ordinal Regression
要約 順序回帰は、特定のタスクに関してカスタマイズされ、よく訓練されたモデルを使 … 続きを読む
Concept Conductor: Orchestrating Multiple Personalized Concepts in Text-to-Image Synthesis
要約 テキストから画像へのモデルのカスタマイズは大幅に進歩しましたが、複数のパー … 続きを読む
Driving Animatronic Robot Facial Expression From Speech
要約 アニマトロニクス ロボットは、本物のような表情を通じて人間とロボットの自然 … 続きを読む
Openstory++: A Large-scale Dataset and Benchmark for Instance-aware Open-domain Visual Storytelling
要約 最近の画像生成モデルは、短いキャプションから高品質の画像を作成することに優 … 続きを読む
カテゴリー: cs.CV
Openstory++: A Large-scale Dataset and Benchmark for Instance-aware Open-domain Visual Storytelling はコメントを受け付けていません