月別アーカイブ: 2023年3月

CheckerPose: Progressive Dense Keypoint Localization for Object Pose Estimation with Graph Neural Network

要約 単一の RGB 画像から剛体の 6-DoF ポーズを推定することは、重要か … 続きを読む

カテゴリー: cs.CV | CheckerPose: Progressive Dense Keypoint Localization for Object Pose Estimation with Graph Neural Network はコメントを受け付けていません

Photometric LiDAR and RGB-D Bundle Adjustment

要約 センサー軌道と 3D マップの同時最適化は、同時位置推定とマッピング (S … 続きを読む

カテゴリー: cs.CV, cs.RO | Photometric LiDAR and RGB-D Bundle Adjustment はコメントを受け付けていません

Instant Neural Radiance Fields Stylization

要約 インスタント ニューラル ラディアンス フィールド スタイライゼーション … 続きを読む

カテゴリー: cs.CV | Instant Neural Radiance Fields Stylization はコメントを受け付けていません

Towards Understanding the Effect of Pretraining Label Granularity

要約 このホワイト ペーパーでは、事前トレーニング ラベルの粒度が、画像分類タス … 続きを読む

カテゴリー: cs.CV, cs.LG | Towards Understanding the Effect of Pretraining Label Granularity はコメントを受け付けていません

RbA: Segmenting Unknown Regions Rejected by All

要約 標準的なセマンティック セグメンテーション モデルは、新しいカテゴリから未 … 続きを読む

カテゴリー: cs.CV | RbA: Segmenting Unknown Regions Rejected by All はコメントを受け付けていません

DPF: Learning Dense Prediction Fields with Weak Supervision

要約 現在、多くの視覚的シーン理解の問題は、密な予測ネットワークによって対処され … 続きを読む

カテゴリー: cs.CV | DPF: Learning Dense Prediction Fields with Weak Supervision はコメントを受け付けていません

Mask-free OVIS: Open-Vocabulary Instance Segmentation without Manual Mask Annotations

要約 既存のインスタンス セグメンテーション モデルは、ベース (トレーニング) … 続きを読む

カテゴリー: cs.CV | Mask-free OVIS: Open-Vocabulary Instance Segmentation without Manual Mask Annotations はコメントを受け付けていません

Multi-scale Hierarchical Vision Transformer with Cascaded Attention Decoding for Medical Image Segmentation

要約 トランスフォーマーは、医用画像のセグメンテーションで大きな成功を収めていま … 続きを読む

カテゴリー: cs.CV, I.4 | Multi-scale Hierarchical Vision Transformer with Cascaded Attention Decoding for Medical Image Segmentation はコメントを受け付けていません

ViewRefer: Grasp the Multi-view Knowledge for 3D Visual Grounding with GPT and Prototype Guidance

要約 マルチビュー入力から 3D シーンを理解することで、3D ビジュアル グラ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | ViewRefer: Grasp the Multi-view Knowledge for 3D Visual Grounding with GPT and Prototype Guidance はコメントを受け付けていません

Physics-Driven Diffusion Models for Impact Sound Synthesis from Videos

要約 物理的なオブジェクトの相互作用から発せられる音をモデリングすることは、現実 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.SD, eess.AS | Physics-Driven Diffusion Models for Impact Sound Synthesis from Videos はコメントを受け付けていません