月別アーカイブ: 2024年9月

Efficient Motion Prediction: A Lightweight & Accurate Trajectory Prediction Model With Fast Training and Inference Speed

要約 効率的かつ安全な自動運転のためには、自動運転車両が他の交通エージェントの動 … 続きを読む

カテゴリー: cs.CV, cs.RO | Efficient Motion Prediction: A Lightweight & Accurate Trajectory Prediction Model With Fast Training and Inference Speed はコメントを受け付けていません

Video-XL: Extra-Long Vision Language Model for Hour-Scale Video Understanding

要約 現在のマルチモーダル大規模言語モデル (MLLM) はビデオ理解において有 … 続きを読む

カテゴリー: cs.CV | Video-XL: Extra-Long Vision Language Model for Hour-Scale Video Understanding はコメントを受け付けていません

ComiCap: A VLMs pipeline for dense captioning of Comic Panels

要約 コミック領域は、単一ページおよび複数ページの分析および合成モデルの開発によ … 続きを読む

カテゴリー: cs.CV | ComiCap: A VLMs pipeline for dense captioning of Comic Panels はコメントを受け付けていません

MIMO: Controllable Character Video Synthesis with Spatial Decomposed Modeling

要約 キャラクター ビデオ合成は、本物のようなシーン内でアニメーション化可能なキ … 続きを読む

カテゴリー: cs.CV | MIMO: Controllable Character Video Synthesis with Spatial Decomposed Modeling はコメントを受け付けていません

GaRField++: Reinforced Gaussian Radiance Fields for Large-Scale 3D Scene Reconstruction

要約 この論文は、3D ガウス スプラッティング (3DGS) に基づく大規模シ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | GaRField++: Reinforced Gaussian Radiance Fields for Large-Scale 3D Scene Reconstruction はコメントを受け付けていません

OpenOOD v1.5: Enhanced Benchmark for Out-of-Distribution Detection

要約 配布外 (OOD) の検出は、オープンワールドのインテリジェント システム … 続きを読む

カテゴリー: cs.CV, cs.LG | OpenOOD v1.5: Enhanced Benchmark for Out-of-Distribution Detection はコメントを受け付けていません

SDFit: 3D Object Pose and Shape by Fitting a Morphable SDF to a Single Image

要約 私たちは、単一の画像から 3D オブジェクトの姿勢と形状を復元することに重 … 続きを読む

カテゴリー: cs.CV | SDFit: 3D Object Pose and Shape by Fitting a Morphable SDF to a Single Image はコメントを受け付けていません

Expert-level vision-language foundation model for real-world radiology and comprehensive evaluation

要約 放射線学は現代の臨床ワークフローの重要かつ複雑な要素であり、多くのタスクを … 続きを読む

カテゴリー: cs.CV | Expert-level vision-language foundation model for real-world radiology and comprehensive evaluation はコメントを受け付けていません

V2X-DGW: Domain Generalization for Multi-agent Perception under Adverse Weather Conditions

要約 現在の LiDAR ベースの Vehicle-to-Everything … 続きを読む

カテゴリー: cs.CV | V2X-DGW: Domain Generalization for Multi-agent Perception under Adverse Weather Conditions はコメントを受け付けていません

Upper-body free-breathing Magnetic Resonance Fingerprinting applied to the quantification of water T1 and fat fraction

要約 過去 10 年にわたり、磁気共鳴フィンガープリンティング (MRF) は、 … 続きを読む

カテゴリー: 68T01, 94A08, cs.CV, eess.IV | Upper-body free-breathing Magnetic Resonance Fingerprinting applied to the quantification of water T1 and fat fraction はコメントを受け付けていません