月別アーカイブ: 2024年5月

3D Neural Edge Reconstruction

要約 現実世界のオブジェクトと環境は、主に直線や曲線などのエッジ フィーチャで構 … 続きを読む

カテゴリー: cs.CV | 3D Neural Edge Reconstruction はコメントを受け付けていません

Neural Isometries: Taming Transformations for Equivariant ML

要約 現実世界のジオメトリと 3D ビジョンのタスクには、扱いやすい分析表現を妨 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG | Neural Isometries: Taming Transformations for Equivariant ML はコメントを受け付けていません

Adaptive Image Quality Assessment via Teaching Large Multimodal Model to Compare

要約 大規模マルチモーダル モデル (LMM) の最近の進歩により、絶対品質評価 … 続きを読む

カテゴリー: cs.CV, eess.IV | Adaptive Image Quality Assessment via Teaching Large Multimodal Model to Compare はコメントを受け付けていません

Real-Time Environment Condition Classification for Autonomous Vehicles

要約 現在の自動運転技術は、動作時間、エリア、気象条件、道路状況などの動作条件が … 続きを読む

カテゴリー: cs.CV | Real-Time Environment Condition Classification for Autonomous Vehicles はコメントを受け付けていません

Matryoshka Query Transformer for Large Vision-Language Models

要約 Large Vision-Language Model (LVLM) は通 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | Matryoshka Query Transformer for Large Vision-Language Models はコメントを受け付けていません

Era3D: High-Resolution Multiview Diffusion using Efficient Row-wise Attention

要約 本稿では、単視点画像から高解像度の多視点画像を生成する新しい多視点拡散手法 … 続きを読む

カテゴリー: cs.CV | Era3D: High-Resolution Multiview Diffusion using Efficient Row-wise Attention はコメントを受け付けていません

DGD: Dynamic 3D Gaussians Distillation

要約 私たちは、単一の単眼ビデオを入力として与えられた動的な 3D セマンティッ … 続きを読む

カテゴリー: cs.CV | DGD: Dynamic 3D Gaussians Distillation はコメントを受け付けていません

Reasoning3D — Grounding and Reasoning in 3D: Fine-Grained Zero-Shot Open-Vocabulary 3D Reasoning Part Segmentation via Large Vision-Language Models

要約 このペーパーでは、新しいタスクを紹介します。部品の検索とオブジェクトの位置 … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.HC | Reasoning3D — Grounding and Reasoning in 3D: Fine-Grained Zero-Shot Open-Vocabulary 3D Reasoning Part Segmentation via Large Vision-Language Models はコメントを受け付けていません

NPGA: Neural Parametric Gaussian Avatars

要約 人間の頭の高忠実度のデジタル バージョンの作成は、仮想コンポーネントを私た … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR | NPGA: Neural Parametric Gaussian Avatars はコメントを受け付けていません

Multi-Modal Generative Embedding Model

要約 ほとんどのマルチモーダル タスクは、生成または埋め込みの問題に定式化できま … 続きを読む

カテゴリー: cs.CV | Multi-Modal Generative Embedding Model はコメントを受け付けていません