- Unified Video Action Model
- OpenFly: A Versatile Toolchain and Large-scale Benchmark for Aerial Vision-Language Navigation
- MARLIN: Multi-Agent Reinforcement Learning Guided by Language-Based Inter-Robot Negotiation
- A comparison of visual representations for real-world reinforcement learning in the context of vacuum gripping
- Predictive Kinematic Coordinate Control for Aerial Manipulators based on Modified Kinematics Learning
表示できるコメントはありません。 cs.AI (34614) cs.CL (26159) cs.CR (2651) cs.CV (40453) cs.LG (39611) cs.RO (20244) cs.SY (3074) eess.IV (4810) eess.SY (3068) stat.ML (5213)
月別アーカイブ: 2024年7月
The Sky’s the Limit: Re-lightable Outdoor Scenes via a Sky-pixel Constrained Illumination Prior and Outside-In Visibility
要約 制約のない画像コレクションから屋外シーンを逆レンダリングすることは、特に照 … 続きを読む
カテゴリー: cs.CV
The Sky’s the Limit: Re-lightable Outdoor Scenes via a Sky-pixel Constrained Illumination Prior and Outside-In Visibility はコメントを受け付けていません
SALSA: Swift Adaptive Lightweight Self-Attention for Enhanced LiDAR Place Recognition
要約 大規模な LiDAR マッピングと位置特定では、場所認識技術を利用してオド … 続きを読む
Local-peak scale-invariant feature transform for fast and random image stitching
要約 画像スティッチングは、高い空間解像度で広い視野を構築することを目的としてい … 続きを読む
カテゴリー: cs.CV
Local-peak scale-invariant feature transform for fast and random image stitching はコメントを受け付けていません
SpotFormer: Multi-Scale Spatio-Temporal Transformer for Facial Expression Spotting
要約 ビデオ内で表情が発生する期間を特定する表情スポッティングは、表情分析におい … 続きを読む
カテゴリー: cs.CV
SpotFormer: Multi-Scale Spatio-Temporal Transformer for Facial Expression Spotting はコメントを受け付けていません
Synthetic Image Learning: Preserving Performance and Preventing Membership Inference Attacks
要約 生成人工知能は合成データの生成を変革し、医療などの分野で特に重要なデータ不 … 続きを読む
Semantic Image Synthesis via Class-Adaptive Cross-Attention
要約 セマンティック画像合成では、最先端の空間適応型 DE 正規化 (SPADE … 続きを読む
Look Around and Learn: Self-Training Object Detection by Exploration
要約 物体検出器を新しい環境に導入すると、パフォーマンスが低下することがよくあり … 続きを読む
カテゴリー: cs.CV
Look Around and Learn: Self-Training Object Detection by Exploration はコメントを受け付けていません
Structure Unbiased Adversarial Model for Medical Image Segmentation
要約 生成モデルは、分布が実際の分布に似ている画像をより多く生成するために画像認 … 続きを読む
WARM-3D: A Weakly-Supervised Sim2Real Domain Adaptation Framework for Roadside Monocular 3D Object Detection
要約 既存の路側認識システムは、公開されている大規模で高品質の 3D データセッ … 続きを読む
カテゴリー: cs.CV
WARM-3D: A Weakly-Supervised Sim2Real Domain Adaptation Framework for Roadside Monocular 3D Object Detection はコメントを受け付けていません
KI-PMF: Knowledge Integrated Plausible Motion Forecasting
要約 自動運転車を大規模に展開するには、交通アクターの動きを正確に予測することが … 続きを読む