月別アーカイブ: 2022年7月

3D Instances as 1D Kernels

要約 インスタンスカーネルと呼ばれる3Dインスタンス表現を紹介します。ここで、イ … 続きを読む

カテゴリー: cs.CV | 3D Instances as 1D Kernels はコメントを受け付けていません

PanoFlow: Learning 360° Optical Flow for Surrounding Temporal Understanding

要約 オプティカルフローの推定は、自動運転およびロボット工学システムの基本的なタ … 続きを読む

カテゴリー: cs.CV, cs.RO, eess.IV | PanoFlow: Learning 360° Optical Flow for Surrounding Temporal Understanding はコメントを受け付けていません

A Dual-Masked Auto-Encoder for Robust Motion Capture with Spatial-Temporal Skeletal Token Completion

要約 重度のオクルージョン、速い体の動き、複雑な相互作用によって引き起こされるあ … 続きを読む

カテゴリー: cs.CV | A Dual-Masked Auto-Encoder for Robust Motion Capture with Spatial-Temporal Skeletal Token Completion はコメントを受け付けていません

Demystifying the Adversarial Robustness of Random Transformation Defenses

要約 ニューラルネットワークの攻撃に対する堅牢性の欠如は、自動運転車などのセキュ … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.CV, cs.LG | Demystifying the Adversarial Robustness of Random Transformation Defenses はコメントを受け付けていません

Implicit Neural Representations for Variable Length Human Motion Generation

要約 変分陰的神経表現(INR)を用いた行動条件付き人間運動生成法を提案する。 … 続きを読む

カテゴリー: cs.CV | Implicit Neural Representations for Variable Length Human Motion Generation はコメントを受け付けていません

clDice — A Novel Topology-Preserving Loss Function for Tubular Structure Segmentation

要約 血管、ニューロン、道路などの管状のネットワークのような構造の正確なセグメン … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | clDice — A Novel Topology-Preserving Loss Function for Tubular Structure Segmentation はコメントを受け付けていません

Recur, Attend or Convolve? On Whether Temporal Modeling Matters for Cross-Domain Robustness in Action Recognition

要約 今日のほとんどの行動認識モデルは高度にパラメーター化されており、主に空間的 … 続きを読む

カテゴリー: cs.CV | Recur, Attend or Convolve? On Whether Temporal Modeling Matters for Cross-Domain Robustness in Action Recognition はコメントを受け付けていません

iColoriT: Towards Propagating Local Hint to the Right Region in Interactive Colorization by Leveraging Vision Transformer

要約 ポイントインタラクティブ画像の色付けは、ユーザーが特定の場所の色を指定した … 続きを読む

カテゴリー: cs.CV | iColoriT: Towards Propagating Local Hint to the Right Region in Interactive Colorization by Leveraging Vision Transformer はコメントを受け付けていません

Multimodal Token Fusion for Vision Transformers

要約 画像のような入力ソースを処理するために自己注意モジュールが積み重ねられるシ … 続きを読む

カテゴリー: cs.CV | Multimodal Token Fusion for Vision Transformers はコメントを受け付けていません

LapSeg3D: Weakly Supervised Semantic Segmentation of Point Clouds Representing Laparoscopic Scenes

要約 手術シーンのセマンティックセグメンテーションは、ロボット支援介入におけるタ … 続きを読む

カテゴリー: 68T40, 68T42 (Primary), cs.AI, cs.CV, cs.LG, cs.RO, I.4 | LapSeg3D: Weakly Supervised Semantic Segmentation of Point Clouds Representing Laparoscopic Scenes はコメントを受け付けていません