月別アーカイブ: 2023年1月

SeaFormer: Squeeze-enhanced Axial Transformer for Mobile Semantic Segmentation

投稿日: 2023年1月31日作成者: jarxiv

要約ビジョントランスフォーマーの導入以来、CNN によって圧倒的に支配されて … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

ESC: Exploration with Soft Commonsense Constraints for Zero-shot Object Navigation

投稿日: 2023年1月31日作成者: jarxiv

要約特定のオブジェクトを正確に見つけてナビゲートする機能は、実世界で動作し、オ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Shape-aware Text-driven Layered Video Editing

投稿日: 2023年1月31日作成者: jarxiv

要約ビデオ編集アプリケーションでは、時間的な一貫性が不可欠です。ビデオの階層 … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

Accurate Gaze Estimation using an Active-gaze Morphable Model

投稿日: 2023年1月31日作成者: jarxiv

要約画像から直接視線方向を回帰するのではなく、3D 形状モデルを追加すると、i … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Extracting Training Data from Diffusion Models

投稿日: 2023年1月31日作成者: jarxiv

要約 DALL-E 2、Imagen、Stable Diffusion などの画 … 続きを読む →

カテゴリー: cs.CR, cs.CV, cs.LG | コメントを受け付けていません

Audio-Visual Segmentation with Semantics

投稿日: 2023年1月31日作成者: jarxiv

要約オーディオビジュアルセグメンテーション (AVS) と呼ばれる新しい問 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Adaptive Computation with Elastic Input Sequence

投稿日: 2023年1月31日作成者: jarxiv

要約問題を解決するとき、人間は、使用する情報の種類、手順、および問題にアプロー … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Unlocking Slot Attention by Changing Optimal Transport Costs

投稿日: 2023年1月31日作成者: jarxiv

要約スロットアテンションは、画像やビデオでオブジェクト中心のモデリングを行う … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Image Restoration with Mean-Reverting Stochastic Differential Equations

投稿日: 2023年1月31日作成者: jarxiv

要約この論文では、汎用画像復元のための確率微分方程式 (SDE) アプローチを … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

PCV: A Point Cloud-Based Network Verifier

投稿日: 2023年1月31日作成者: jarxiv

要約リアルタイムの LiDAR ベースの点群データを使用した 3D ビジョンは … 続きを読む →

カテゴリー: cs.CV, cs.SE, I.2.10 | コメントを受け付けていません

月別アーカイブ: 2023年1月

SeaFormer: Squeeze-enhanced Axial Transformer for Mobile Semantic Segmentation

ESC: Exploration with Soft Commonsense Constraints for Zero-shot Object Navigation

Shape-aware Text-driven Layered Video Editing

Accurate Gaze Estimation using an Active-gaze Morphable Model

Extracting Training Data from Diffusion Models

Audio-Visual Segmentation with Semantics

Adaptive Computation with Elastic Input Sequence

Unlocking Slot Attention by Changing Optimal Transport Costs

Image Restoration with Mean-Reverting Stochastic Differential Equations

PCV: A Point Cloud-Based Network Verifier

最近の投稿

最近のコメント

アーカイブ

カテゴリー