cs.CV」カテゴリーアーカイブ

HA-FGOVD: Highlighting Fine-grained Attributes via Explicit Linear Composition for Open-Vocabulary Object Detection

要約 オープン語彙オブジェクト検出 (OVD) モデルは、その広範なトレーニング … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | HA-FGOVD: Highlighting Fine-grained Attributes via Explicit Linear Composition for Open-Vocabulary Object Detection はコメントを受け付けていません

GGHead: Fast and Generalizable 3D Gaussian Heads

要約 大規模な 2D 画像コレクションから 3D 頭部事前分布を学習することは、 … 続きを読む

カテゴリー: cs.CV | GGHead: Fast and Generalizable 3D Gaussian Heads はコメントを受け付けていません

Seeing Faces in Things: A Model and Dataset for Pareidolia

要約 人間の視覚システムは、あらゆる形や大きさの顔を検出できるようにうまく調整さ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.HC, cs.IR, cs.LG | Seeing Faces in Things: A Model and Dataset for Pareidolia はコメントを受け付けていません

Efficient Motion Prediction: A Lightweight & Accurate Trajectory Prediction Model With Fast Training and Inference Speed

要約 効率的かつ安全な自動運転のためには、自動運転車両が他の交通エージェントの動 … 続きを読む

カテゴリー: cs.CV, cs.RO | Efficient Motion Prediction: A Lightweight & Accurate Trajectory Prediction Model With Fast Training and Inference Speed はコメントを受け付けていません

Video-XL: Extra-Long Vision Language Model for Hour-Scale Video Understanding

要約 現在のマルチモーダル大規模言語モデル (MLLM) はビデオ理解において有 … 続きを読む

カテゴリー: cs.CV | Video-XL: Extra-Long Vision Language Model for Hour-Scale Video Understanding はコメントを受け付けていません

ComiCap: A VLMs pipeline for dense captioning of Comic Panels

要約 コミック領域は、単一ページおよび複数ページの分析および合成モデルの開発によ … 続きを読む

カテゴリー: cs.CV | ComiCap: A VLMs pipeline for dense captioning of Comic Panels はコメントを受け付けていません

MIMO: Controllable Character Video Synthesis with Spatial Decomposed Modeling

要約 キャラクター ビデオ合成は、本物のようなシーン内でアニメーション化可能なキ … 続きを読む

カテゴリー: cs.CV | MIMO: Controllable Character Video Synthesis with Spatial Decomposed Modeling はコメントを受け付けていません

GaRField++: Reinforced Gaussian Radiance Fields for Large-Scale 3D Scene Reconstruction

要約 この論文は、3D ガウス スプラッティング (3DGS) に基づく大規模シ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | GaRField++: Reinforced Gaussian Radiance Fields for Large-Scale 3D Scene Reconstruction はコメントを受け付けていません

OpenOOD v1.5: Enhanced Benchmark for Out-of-Distribution Detection

要約 配布外 (OOD) の検出は、オープンワールドのインテリジェント システム … 続きを読む

カテゴリー: cs.CV, cs.LG | OpenOOD v1.5: Enhanced Benchmark for Out-of-Distribution Detection はコメントを受け付けていません

SDFit: 3D Object Pose and Shape by Fitting a Morphable SDF to a Single Image

要約 私たちは、単一の画像から 3D オブジェクトの姿勢と形状を復元することに重 … 続きを読む

カテゴリー: cs.CV | SDFit: 3D Object Pose and Shape by Fitting a Morphable SDF to a Single Image はコメントを受け付けていません