-
最近の投稿
- Enhancing Heterogeneous Multi-Agent Cooperation in Decentralized MARL via GNN-driven Intrinsic Rewards
- OrbitGrasp: $SE(3)$-Equivariant Grasp Learning
- M3Bench: Benchmarking Whole-body Motion Generation for Mobile Manipulation in 3D Scenes
- Self-Supervised Learning For Robust Robotic Grasping In Dynamic Environment
- Routing and Scheduling Optimization for Urban Air Mobility Fleet Management using Quantum Annealing
-
最近のコメント
表示できるコメントはありません。 cs.AI (28126) cs.CL (21249) cs.CR (2197) cs.CV (34799) cs.LG (32858) cs.RO (16174) cs.SY (2496) eess.IV (4244) eess.SY (2490) stat.ML (4401)
月別アーカイブ: 2024年2月
NeRF-Det++: Incorporating Semantic Cues and Perspective-aware Depth Supervision for Indoor Multi-View 3D Detection
要約 NeRF-Det は、NeRF を革新的に利用して表現学習を強化することに … 続きを読む
カテゴリー: cs.CV
NeRF-Det++: Incorporating Semantic Cues and Perspective-aware Depth Supervision for Indoor Multi-View 3D Detection はコメントを受け付けていません
AQD: Towards Accurate Fully-Quantized Object Detection
要約 ネットワーク量子化により、低精度の演算を使用して推論を実行できるようになり … 続きを読む
カテゴリー: cs.CV
AQD: Towards Accurate Fully-Quantized Object Detection はコメントを受け付けていません
Reimagining Anomalies: What If Anomalies Were Normal?
要約 深層学習ベースの手法は、画像の異常検出において画期的な進歩を遂げましたが、 … 続きを読む
Single-Model Attribution of Generative Models Through Final-Layer Inversion
要約 生成モデリングにおける最近の進歩により、実用的な単一モデルのアトリビューシ … 続きを読む
A Class of Topological Pseudodistances for Fast Comparison of Persistence Diagrams
要約 パーシステンス ダイアグラム (PD) はトポロジカル データ分析で中心的 … 続きを読む
Towards Seamless Adaptation of Pre-trained Models for Visual Place Recognition
要約 最近の研究では、大規模データを使用した一般的な視覚学習タスクで事前トレーニ … 続きを読む
Deep vessel segmentation based on a new combination of vesselness filters
要約 血管セグメンテーションは重要な臨床タスクですが、その自動化は依然として課題 … 続きを読む
YOLO-World: Real-Time Open-Vocabulary Object Detection
要約 You Only Look Once (YOLO) シリーズの検出器は、効 … 続きを読む
カテゴリー: cs.CV
YOLO-World: Real-Time Open-Vocabulary Object Detection はコメントを受け付けていません
Less is More: Mitigating Multimodal Hallucination from an EOS Decision Perspective
要約 大規模マルチモーダル モデル (LMM) は、視覚入力に存在しないコンテン … 続きを読む
FLATTEN: optical FLow-guided ATTENtion for consistent text-to-video editing
要約 テキストからビデオへの編集は、テキストのプロンプトを条件としてソースビデオ … 続きを読む
カテゴリー: cs.CV
FLATTEN: optical FLow-guided ATTENtion for consistent text-to-video editing はコメントを受け付けていません