月別アーカイブ: 2024年3月

You Only Learn One Query: Learning Unified Human Query for Single-Stage Multi-Person Multi-Task Human-Centric Perception

要約 人間中心の認識 (歩行者の検出、セグメンテーション、姿勢推定、属性分析など … 続きを読む

カテゴリー: cs.CV | You Only Learn One Query: Learning Unified Human Query for Single-Stage Multi-Person Multi-Task Human-Centric Perception はコメントを受け付けていません

VisionGPT-3D: A Generalized Multimodal Agent for Enhanced 3D Vision Understanding

要約 テキストからビジュアルコンポーネントへの進化により、テキストから画像やビデ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.GR | VisionGPT-3D: A Generalized Multimodal Agent for Enhanced 3D Vision Understanding はコメントを受け付けていません

Mamba-ND: Selective State Space Modeling for Multi-Dimensional Data

要約 近年、Transformers は、テキストおよび画像やビデオなどのさまざ … 続きを読む

カテゴリー: cs.CV | Mamba-ND: Selective State Space Modeling for Multi-Dimensional Data はコメントを受け付けていません

TTA-Nav: Test-time Adaptive Reconstruction for Point-Goal Navigation under Visual Corruptions

要約 視覚的に破損した状態でのロボットのナビゲーションは、大きな課題となります。 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | TTA-Nav: Test-time Adaptive Reconstruction for Point-Goal Navigation under Visual Corruptions はコメントを受け付けていません

Explorations in Texture Learning

要約 この研究では、\textit{テクスチャ学習}、つまりオブジェクト分類モデ … 続きを読む

カテゴリー: cs.CV, cs.LG | Explorations in Texture Learning はコメントを受け付けていません

Probabilistic Contrastive Learning for Long-Tailed Visual Recognition

要約 現実世界のデータでは、多数の少数カテゴリーに限られた数のサンプルが含まれる … 続きを読む

カテゴリー: cs.CV, cs.LG | Probabilistic Contrastive Learning for Long-Tailed Visual Recognition はコメントを受け付けていません

ZeroFlow: Scalable Scene Flow via Distillation

要約 シーン フロー推定は、時間的に連続する点群間の 3D モーション フィール … 続きを読む

カテゴリー: cs.CV, cs.LG | ZeroFlow: Scalable Scene Flow via Distillation はコメントを受け付けていません

WeakSurg: Weakly supervised surgical instrument segmentation using temporal equivariance and semantic continuity

要約 器具の存在ラベルのみを使用した弱く監視された外科器具のセグメンテーションは … 続きを読む

カテゴリー: cs.CV | WeakSurg: Weakly supervised surgical instrument segmentation using temporal equivariance and semantic continuity はコメントを受け付けていません

Cloud gap-filling with deep learning for improved grassland monitoring

要約 途切れのない光学画像の時系列は、農地の変化をタイムリーに監視するために非常 … 続きを読む

カテゴリー: cs.CV, eess.IV | Cloud gap-filling with deep learning for improved grassland monitoring はコメントを受け付けていません

CURSOR: Scalable Mixed-Order Hypergraph Matching with CUR Decomposition

要約 より高い精度を達成するには、ハイパーグラフ マッチング アルゴリズムの計算 … 続きを読む

カテゴリー: cs.CV | CURSOR: Scalable Mixed-Order Hypergraph Matching with CUR Decomposition はコメントを受け付けていません