「cs.CV」カテゴリーアーカイブ

Promptable Closed-loop Traffic Simulation

投稿日: 2024年9月10日作成者: jarxiv

要約シミュレーションは、安全かつ効率的な自動運転開発の基礎となります。シミュ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

Neural MP: A Generalist Neural Motion Planner

投稿日: 2024年9月10日作成者: jarxiv

要約現在の動作計画のパラダイムでは、新たな問題が発生するたびにソリューションを … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Flash Cache: Reducing Bias in Radiance Cache Based Inverse Rendering

投稿日: 2024年9月10日作成者: jarxiv

要約 3D 再構成のための最先端の技術は主にボリュームシーン表現に基づいており … 続きを読む →

カテゴリー: cs.CV, cs.GR | コメントを受け付けていません

HiSC4D: Human-centered interaction and 4D Scene Capture in Large-scale Space Using Wearable IMUs and LiDAR

投稿日: 2024年9月10日作成者: jarxiv

要約大規模な屋内と屋外のシーン、多様な人間の動き、豊かな人間と人間の相互作用、 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.GR, cs.MM | コメントを受け付けていません

Question-Answering Dense Video Events

投稿日: 2024年9月10日作成者: jarxiv

要約マルチモーダル大規模言語モデル (MLLM) は、単一イベントビデオの質 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM | コメントを受け付けていません

HiPrompt: Tuning-free Higher-Resolution Generation with Hierarchical MLLM Prompts

投稿日: 2024年9月10日作成者: jarxiv

要約事前トレーニングされた拡散モデルを使用した高解像度画像生成の可能性は計り知 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Diagram Formalization Enhanced Multi-Modal Geometry Problem Solver

投稿日: 2024年9月10日作成者: jarxiv

要約数学的推論は、AI モデル、特に言語信号と視覚信号の両方を必要とする幾何学 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Introducing a Class-Aware Metric for Monocular Depth Estimation: An Automotive Perspective

投稿日: 2024年9月9日作成者: jarxiv

要約メートル単位の単眼奥行き推定モデルのレポートの精度が向上しているため、自動 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Hyp2Nav: Hyperbolic Planning and Curiosity for Crowd Navigation

投稿日: 2024年9月9日作成者: jarxiv

要約自律型ロボットは社会環境においてますます有力な存在となりつつあります。効 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

White-Box Transformers via Sparse Rate Reduction: Compression Is All There Is?

投稿日: 2024年9月9日作成者: jarxiv

要約この論文では、表現学習の自然な目的は、データの分布、たとえばトークンのセッ … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Promptable Closed-loop Traffic Simulation

Neural MP: A Generalist Neural Motion Planner

Flash Cache: Reducing Bias in Radiance Cache Based Inverse Rendering

HiSC4D: Human-centered interaction and 4D Scene Capture in Large-scale Space Using Wearable IMUs and LiDAR

Question-Answering Dense Video Events

HiPrompt: Tuning-free Higher-Resolution Generation with Hierarchical MLLM Prompts

Diagram Formalization Enhanced Multi-Modal Geometry Problem Solver

Introducing a Class-Aware Metric for Monocular Depth Estimation: An Automotive Perspective

Hyp2Nav: Hyperbolic Planning and Curiosity for Crowd Navigation

White-Box Transformers via Sparse Rate Reduction: Compression Is All There Is?

最近の投稿

最近のコメント

アーカイブ

カテゴリー