cs.CV」カテゴリーアーカイブ

LMPOcc: 3D Semantic Occupancy Prediction Utilizing Long-Term Memory Prior from Historical Traversals

要約 ビジョンベースの3Dセマンティック占有率予測は、自律的な運転に重要であり、 … 続きを読む

カテゴリー: cs.CV, cs.RO | LMPOcc: 3D Semantic Occupancy Prediction Utilizing Long-Term Memory Prior from Historical Traversals はコメントを受け付けていません

EVA: An Embodied World Model for Future Video Anticipation

要約 ビデオ生成モデルは、将来の状態をシミュレートする際に大きな進歩を遂げ、具体 … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.RO | EVA: An Embodied World Model for Future Video Anticipation はコメントを受け付けていません

Adaptive path planning for efficient object search by UAVs in agricultural fields

要約 このペーパーでは、UAVを使用して農業分野でのオブジェクト検索の適応パスプ … 続きを読む

カテゴリー: cs.CV, cs.RO | Adaptive path planning for efficient object search by UAVs in agricultural fields はコメントを受け付けていません

PhyBlock: A Progressive Benchmark for Physical Understanding and Planning via 3D Block Assembly

要約 ビジョン言語モデル(VLM)は、具体化されたエージェントの推論と計画におい … 続きを読む

カテゴリー: cs.CV, cs.RO | PhyBlock: A Progressive Benchmark for Physical Understanding and Planning via 3D Block Assembly はコメントを受け付けていません

Enhancing Safety of Foundation Models for Visual Navigation through Collision Avoidance via Repulsive Estimation

要約 追加の範囲センサーを必要とせずに視覚ベースのナビゲーションの安全性を高める … 続きを読む

カテゴリー: cs.CV, cs.RO | Enhancing Safety of Foundation Models for Visual Navigation through Collision Avoidance via Repulsive Estimation はコメントを受け付けていません

A PDE-Based Image Dehazing Method via Atmospheric Scattering Theory

要約 このホワイトペーパーでは、シングルイメージの脱毛のための新しい部分微分方程 … 続きを読む

カテゴリー: cs.CV, eess.IV | A PDE-Based Image Dehazing Method via Atmospheric Scattering Theory はコメントを受け付けていません

Flow Diverse and Efficient: Learning Momentum Flow Matching via Stochastic Velocity Field Sampling

要約 最近、特にFlux 1.0やSD 3.0などの一連のRFモデルによって生成 … 続きを読む

カテゴリー: cs.CV | Flow Diverse and Efficient: Learning Momentum Flow Matching via Stochastic Velocity Field Sampling はコメントを受け付けていません

CAD-Llama: Leveraging Large Language Models for Computer-Aided Design Parametric 3D Model Generation

要約 最近、大規模な言語モデル(LLM)が大幅に成功し、一般的なテキストを超えて … 続きを読む

カテゴリー: cs.CV | CAD-Llama: Leveraging Large Language Models for Computer-Aided Design Parametric 3D Model Generation はコメントを受け付けていません

HunyuanVideo-HOMA: Generic Human-Object Interaction in Multimodal Driven Human Animation

要約 人間とオブジェクトの相互作用(HOI)ビデオ生成の重要な制限に対処するため … 続きを読む

カテゴリー: cs.CV | HunyuanVideo-HOMA: Generic Human-Object Interaction in Multimodal Driven Human Animation はコメントを受け付けていません

ZigzagPointMamba: Spatial-Semantic Mamba for Point Cloud Understanding

要約 Pointmambaなどの状態空間モデル(SSM)は、線形の複雑さを伴うポ … 続きを読む

カテゴリー: cs.CV | ZigzagPointMamba: Spatial-Semantic Mamba for Point Cloud Understanding はコメントを受け付けていません