-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
LMPOcc: 3D Semantic Occupancy Prediction Utilizing Long-Term Memory Prior from Historical Traversals
要約 ビジョンベースの3Dセマンティック占有率予測は、自律的な運転に重要であり、 … 続きを読む
EVA: An Embodied World Model for Future Video Anticipation
要約 ビデオ生成モデルは、将来の状態をシミュレートする際に大きな進歩を遂げ、具体 … 続きを読む
Adaptive path planning for efficient object search by UAVs in agricultural fields
要約 このペーパーでは、UAVを使用して農業分野でのオブジェクト検索の適応パスプ … 続きを読む
PhyBlock: A Progressive Benchmark for Physical Understanding and Planning via 3D Block Assembly
要約 ビジョン言語モデル(VLM)は、具体化されたエージェントの推論と計画におい … 続きを読む
Enhancing Safety of Foundation Models for Visual Navigation through Collision Avoidance via Repulsive Estimation
要約 追加の範囲センサーを必要とせずに視覚ベースのナビゲーションの安全性を高める … 続きを読む
A PDE-Based Image Dehazing Method via Atmospheric Scattering Theory
要約 このホワイトペーパーでは、シングルイメージの脱毛のための新しい部分微分方程 … 続きを読む
Flow Diverse and Efficient: Learning Momentum Flow Matching via Stochastic Velocity Field Sampling
要約 最近、特にFlux 1.0やSD 3.0などの一連のRFモデルによって生成 … 続きを読む
カテゴリー: cs.CV
Flow Diverse and Efficient: Learning Momentum Flow Matching via Stochastic Velocity Field Sampling はコメントを受け付けていません
CAD-Llama: Leveraging Large Language Models for Computer-Aided Design Parametric 3D Model Generation
要約 最近、大規模な言語モデル(LLM)が大幅に成功し、一般的なテキストを超えて … 続きを読む
カテゴリー: cs.CV
CAD-Llama: Leveraging Large Language Models for Computer-Aided Design Parametric 3D Model Generation はコメントを受け付けていません
HunyuanVideo-HOMA: Generic Human-Object Interaction in Multimodal Driven Human Animation
要約 人間とオブジェクトの相互作用(HOI)ビデオ生成の重要な制限に対処するため … 続きを読む
カテゴリー: cs.CV
HunyuanVideo-HOMA: Generic Human-Object Interaction in Multimodal Driven Human Animation はコメントを受け付けていません
ZigzagPointMamba: Spatial-Semantic Mamba for Point Cloud Understanding
要約 Pointmambaなどの状態空間モデル(SSM)は、線形の複雑さを伴うポ … 続きを読む
カテゴリー: cs.CV
ZigzagPointMamba: Spatial-Semantic Mamba for Point Cloud Understanding はコメントを受け付けていません