cs.CV」カテゴリーアーカイブ

Imperative Learning: A Self-supervised Neural-Symbolic Learning Framework for Robot Autonomy

要約 強化学習や模倣学習などのデータ駆動型の手法は、ロボットの自律性において目覚 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Imperative Learning: A Self-supervised Neural-Symbolic Learning Framework for Robot Autonomy はコメントを受け付けていません

Leveraging LLMs for Enhanced Open-Vocabulary 3D Scene Understanding in Autonomous Driving

要約 この論文では、言語埋め込み 3D ガウシアンと大規模言語モデル (LLM) … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | Leveraging LLMs for Enhanced Open-Vocabulary 3D Scene Understanding in Autonomous Driving はコメントを受け付けていません

VPOcc: Exploiting Vanishing Point for Monocular 3D Semantic Occupancy Prediction

要約 単眼 3D セマンティック占有予測は、単一の RGB カメラを使用するコン … 続きを読む

カテゴリー: cs.CV, cs.RO | VPOcc: Exploiting Vanishing Point for Monocular 3D Semantic Occupancy Prediction はコメントを受け付けていません

IG-SLAM: Instant Gaussian SLAM

要約 3D ガウス スプラッティングは、SLAM システムにおけるニューラル暗黙 … 続きを読む

カテゴリー: cs.CV, cs.RO | IG-SLAM: Instant Gaussian SLAM はコメントを受け付けていません

Unleashing the Power of Data Tsunami: A Comprehensive Survey on Data Assessment and Selection for Instruction Tuning of Language Models

要約 命令チューニングは、大規模言語モデル (LLM) を人間の好みに合わせる上 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, eess.SP | Unleashing the Power of Data Tsunami: A Comprehensive Survey on Data Assessment and Selection for Instruction Tuning of Language Models はコメントを受け付けていません

Unlocking Exocentric Video-Language Data for Egocentric Video Representation Learning

要約 我々は、自己中心的なビデオ表現学習のためにエキソセントリックなビデオ言語デ … 続きを読む

カテゴリー: cs.CL, cs.CV | Unlocking Exocentric Video-Language Data for Egocentric Video Representation Learning はコメントを受け付けていません

Teach CLIP to Develop a Number Sense for Ordinal Regression

要約 順序回帰は、特定のタスクに関してカスタマイズされ、よく訓練されたモデルを使 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | Teach CLIP to Develop a Number Sense for Ordinal Regression はコメントを受け付けていません

Concept Conductor: Orchestrating Multiple Personalized Concepts in Text-to-Image Synthesis

要約 テキストから画像へのモデルのカスタマイズは大幅に進歩しましたが、複数のパー … 続きを読む

カテゴリー: 68U10, cs.AI, cs.CV, cs.MM, I.4.9 | Concept Conductor: Orchestrating Multiple Personalized Concepts in Text-to-Image Synthesis はコメントを受け付けていません

Driving Animatronic Robot Facial Expression From Speech

要約 アニマトロニクス ロボットは、本物のような表情を通じて人間とロボットの自然 … 続きを読む

カテゴリー: cs.CV, cs.RO | Driving Animatronic Robot Facial Expression From Speech はコメントを受け付けていません

Openstory++: A Large-scale Dataset and Benchmark for Instance-aware Open-domain Visual Storytelling

要約 最近の画像生成モデルは、短いキャプションから高品質の画像を作成することに優 … 続きを読む

カテゴリー: cs.CV | Openstory++: A Large-scale Dataset and Benchmark for Instance-aware Open-domain Visual Storytelling はコメントを受け付けていません