月別アーカイブ: 2024年5月

3D Neural Edge Reconstruction

投稿日: 2024年5月30日作成者: jarxiv

要約現実世界のオブジェクトと環境は、主に直線や曲線などのエッジフィーチャで構 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Neural Isometries: Taming Transformations for Equivariant ML

投稿日: 2024年5月30日作成者: jarxiv

要約現実世界のジオメトリと 3D ビジョンのタスクには、扱いやすい分析表現を妨 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG | コメントを受け付けていません

Adaptive Image Quality Assessment via Teaching Large Multimodal Model to Compare

投稿日: 2024年5月30日作成者: jarxiv

要約大規模マルチモーダルモデル (LMM) の最近の進歩により、絶対品質評価 … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

Real-Time Environment Condition Classification for Autonomous Vehicles

投稿日: 2024年5月30日作成者: jarxiv

要約現在の自動運転技術は、動作時間、エリア、気象条件、道路状況などの動作条件が … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Matryoshka Query Transformer for Large Vision-Language Models

投稿日: 2024年5月30日作成者: jarxiv

要約 Large Vision-Language Model (LVLM) は通 … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Era3D: High-Resolution Multiview Diffusion using Efficient Row-wise Attention

投稿日: 2024年5月30日作成者: jarxiv

要約本稿では、単視点画像から高解像度の多視点画像を生成する新しい多視点拡散手法 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

DGD: Dynamic 3D Gaussians Distillation

投稿日: 2024年5月30日作成者: jarxiv

要約私たちは、単一の単眼ビデオを入力として与えられた動的な 3D セマンティッ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Reasoning3D — Grounding and Reasoning in 3D: Fine-Grained Zero-Shot Open-Vocabulary 3D Reasoning Part Segmentation via Large Vision-Language Models

投稿日: 2024年5月30日作成者: jarxiv

要約このペーパーでは、新しいタスクを紹介します。部品の検索とオブジェクトの位置 … 続きを読む →

カテゴリー: cs.CV, cs.GR, cs.HC | コメントを受け付けていません

NPGA: Neural Parametric Gaussian Avatars

投稿日: 2024年5月30日作成者: jarxiv

要約人間の頭の高忠実度のデジタルバージョンの作成は、仮想コンポーネントを私た … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.GR | コメントを受け付けていません

Multi-Modal Generative Embedding Model

投稿日: 2024年5月30日作成者: jarxiv

要約ほとんどのマルチモーダルタスクは、生成または埋め込みの問題に定式化できま … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

月別アーカイブ: 2024年5月

3D Neural Edge Reconstruction

Neural Isometries: Taming Transformations for Equivariant ML

Adaptive Image Quality Assessment via Teaching Large Multimodal Model to Compare

Real-Time Environment Condition Classification for Autonomous Vehicles

Matryoshka Query Transformer for Large Vision-Language Models

Era3D: High-Resolution Multiview Diffusion using Efficient Row-wise Attention

DGD: Dynamic 3D Gaussians Distillation

Reasoning3D — Grounding and Reasoning in 3D: Fine-Grained Zero-Shot Open-Vocabulary 3D Reasoning Part Segmentation via Large Vision-Language Models

NPGA: Neural Parametric Gaussian Avatars

Multi-Modal Generative Embedding Model

最近の投稿

最近のコメント

アーカイブ

カテゴリー