月別アーカイブ: 2024年8月

BoostTrack++: using tracklet information to detect more objects in multiple object tracking

要約 複数オブジェクト追跡 (MOT) は、真陽性で検出された境界ボックスの選択 … 続きを読む

カテゴリー: cs.AI, cs.CV | BoostTrack++: using tracklet information to detect more objects in multiple object tracking はコメントを受け付けていません

EasyControl: Transfer ControlNet to Video Diffusion for Controllable Generation and Interpolation

要約 Stable Diffusion に代表されるテキストガイドによる画像生成 … 続きを読む

カテゴリー: cs.CV | EasyControl: Transfer ControlNet to Video Diffusion for Controllable Generation and Interpolation はコメントを受け付けていません

Collaborative Control for Geometry-Conditioned PBR Image Generation

要約 グラフィックス パイプラインには物理ベース レンダリング (PBR) マテ … 続きを読む

カテゴリー: cs.CV, cs.GR, I.4.0 | Collaborative Control for Geometry-Conditioned PBR Image Generation はコメントを受け付けていません

MAML MOT: Multiple Object Tracking based on Meta-Learning

要約 ビデオ分析技術の進歩に伴い、歩行者が関与する複雑なシーンにおけるマルチオブ … 続きを読む

カテゴリー: cs.AI, cs.CV | MAML MOT: Multiple Object Tracking based on Meta-Learning はコメントを受け付けていません

TokenPacker: Efficient Visual Projector for Multimodal LLM

要約 ビジュアル プロジェクターは、マルチモーダル LLM (MLLM) におけ … 続きを読む

カテゴリー: cs.CV | TokenPacker: Efficient Visual Projector for Multimodal LLM はコメントを受け付けていません

Learning 2D Invariant Affordance Knowledge for 3D Affordance Grounding

要約 3D オブジェクト アフォーダンス グランディングは、3D オブジェクト上 … 続きを読む

カテゴリー: cs.CV | Learning 2D Invariant Affordance Knowledge for 3D Affordance Grounding はコメントを受け付けていません

Indoor scene recognition from images under visual corruptions

要約 屋内シーンの分類は、生活支援のためのインテリジェント ロボット工学などのさ … 続きを読む

カテゴリー: cs.CV | Indoor scene recognition from images under visual corruptions はコメントを受け付けていません

PreAfford: Universal Affordance-Based Pre-Grasping for Diverse Objects and Environments

要約 2 本の指グリッパーを使用したロボット操作は、明確な把握可能な機能が欠けて … 続きを読む

カテゴリー: cs.CV, cs.RO | PreAfford: Universal Affordance-Based Pre-Grasping for Diverse Objects and Environments はコメントを受け付けていません

VFM-Det: Towards High-Performance Vehicle Detection via Large Foundation Models

要約 既存の車両検出器は通常、事前にトレーニングされたバックボーン (ResNe … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.NE | VFM-Det: Towards High-Performance Vehicle Detection via Large Foundation Models はコメントを受け付けていません

S4D: Streaming 4D Real-World Reconstruction with Gaussians and 3D Control Points

要約 最近、ガウシアンを使用したダイナミックなシーンの再構成への関心が高まってい … 続きを読む

カテゴリー: cs.CV | S4D: Streaming 4D Real-World Reconstruction with Gaussians and 3D Control Points はコメントを受け付けていません