「cs.CV」カテゴリーアーカイブ

Imperative Learning: A Self-supervised Neural-Symbolic Learning Framework for Robot Autonomy

投稿日: 2024年8月8日作成者: jarxiv

要約強化学習や模倣学習などのデータ駆動型の手法は、ロボットの自律性において目覚 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Leveraging LLMs for Enhanced Open-Vocabulary 3D Scene Understanding in Autonomous Driving

投稿日: 2024年8月8日作成者: jarxiv

要約この論文では、言語埋め込み 3D ガウシアンと大規模言語モデル (LLM) … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.RO | コメントを受け付けていません

VPOcc: Exploiting Vanishing Point for Monocular 3D Semantic Occupancy Prediction

投稿日: 2024年8月8日作成者: jarxiv

要約単眼 3D セマンティック占有予測は、単一の RGB カメラを使用するコン … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

IG-SLAM: Instant Gaussian SLAM

投稿日: 2024年8月8日作成者: jarxiv

要約 3D ガウススプラッティングは、SLAM システムにおけるニューラル暗黙 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Unleashing the Power of Data Tsunami: A Comprehensive Survey on Data Assessment and Selection for Instruction Tuning of Language Models

投稿日: 2024年8月8日作成者: jarxiv

要約命令チューニングは、大規模言語モデル (LLM) を人間の好みに合わせる上 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, eess.SP | コメントを受け付けていません

Unlocking Exocentric Video-Language Data for Egocentric Video Representation Learning

投稿日: 2024年8月8日作成者: jarxiv

要約我々は、自己中心的なビデオ表現学習のためにエキソセントリックなビデオ言語デ … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Teach CLIP to Develop a Number Sense for Ordinal Regression

投稿日: 2024年8月8日作成者: jarxiv

要約順序回帰は、特定のタスクに関してカスタマイズされ、よく訓練されたモデルを使 … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Concept Conductor: Orchestrating Multiple Personalized Concepts in Text-to-Image Synthesis

投稿日: 2024年8月8日作成者: jarxiv

要約テキストから画像へのモデルのカスタマイズは大幅に進歩しましたが、複数のパー … 続きを読む →

カテゴリー: 68U10, cs.AI, cs.CV, cs.MM, I.4.9 | コメントを受け付けていません

Driving Animatronic Robot Facial Expression From Speech

投稿日: 2024年8月8日作成者: jarxiv

要約アニマトロニクスロボットは、本物のような表情を通じて人間とロボットの自然 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Openstory++: A Large-scale Dataset and Benchmark for Instance-aware Open-domain Visual Storytelling

投稿日: 2024年8月8日作成者: jarxiv

要約最近の画像生成モデルは、短いキャプションから高品質の画像を作成することに優 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Imperative Learning: A Self-supervised Neural-Symbolic Learning Framework for Robot Autonomy

Leveraging LLMs for Enhanced Open-Vocabulary 3D Scene Understanding in Autonomous Driving

VPOcc: Exploiting Vanishing Point for Monocular 3D Semantic Occupancy Prediction

IG-SLAM: Instant Gaussian SLAM

Unleashing the Power of Data Tsunami: A Comprehensive Survey on Data Assessment and Selection for Instruction Tuning of Language Models

Unlocking Exocentric Video-Language Data for Egocentric Video Representation Learning

Teach CLIP to Develop a Number Sense for Ordinal Regression

Concept Conductor: Orchestrating Multiple Personalized Concepts in Text-to-Image Synthesis

Driving Animatronic Robot Facial Expression From Speech

Openstory++: A Large-scale Dataset and Benchmark for Instance-aware Open-domain Visual Storytelling

最近の投稿

最近のコメント

アーカイブ

カテゴリー