月別アーカイブ: 2023年3月

CODA-Prompt: COntinual Decomposed Attention-based Prompting for Rehearsal-Free Continual Learning

要約 コンピューター ビジョン モデルは、継続的に変化するトレーニング データか … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | CODA-Prompt: COntinual Decomposed Attention-based Prompting for Rehearsal-Free Continual Learning はコメントを受け付けていません

Neglected Free Lunch — Learning Image Classifiers Using Annotation Byproducts

要約 画像分類子の教師あり学習は、画像と対応するラベル (X,Y) のペアを通じ … 続きを読む

カテゴリー: cs.CV, cs.LG | Neglected Free Lunch — Learning Image Classifiers Using Annotation Byproducts はコメントを受け付けていません

MobileInst: Video Instance Segmentation on the Mobile

要約 ビデオインスタンスのセグメンテーションを目的とした最近のアプローチは有望な … 続きを読む

カテゴリー: cs.CV | MobileInst: Video Instance Segmentation on the Mobile はコメントを受け付けていません

ConStruct-VL: Data-Free Continual Structured VL Concepts Learning

要約 最近、大規模な事前トレーニング済みのビジョンと言語 (VL) の基礎モデル … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | ConStruct-VL: Data-Free Continual Structured VL Concepts Learning はコメントを受け付けていません

Robo3D: Towards Robust and Reliable 3D Perception against Corruptions

要約 環境やセンサーからの自然な破損の下での 3D 認識システムの堅牢性は、安全 … 続きを読む

カテゴリー: cs.CV, cs.RO | Robo3D: Towards Robust and Reliable 3D Perception against Corruptions はコメントを受け付けていません

Consistent View Synthesis with Pose-Guided Diffusion Models

要約 単一の画像からの新しいビューの合成は、没入型の体験を提供する多くの仮想現実 … 続きを読む

カテゴリー: cs.CV | Consistent View Synthesis with Pose-Guided Diffusion Models はコメントを受け付けていません

Zero-Shot Video Editing Using Off-The-Shelf Image Diffusion Models

要約 大規模なテキストから画像への拡散モデルは、画像の生成と編集において前例のな … 続きを読む

カテゴリー: cs.CV | Zero-Shot Video Editing Using Off-The-Shelf Image Diffusion Models はコメントを受け付けていません

When Learning Is Out of Reach, Reset: Generalization in Autonomous Visuomotor Reinforcement Learning

要約 成功または失敗のたびにエージェントの環境がリセットされるエピソード トレー … 続きを読む

カテゴリー: cs.CV, cs.RO | When Learning Is Out of Reach, Reset: Generalization in Autonomous Visuomotor Reinforcement Learning はコメントを受け付けていません

Beyond Appearance: a Semantic Controllable Self-Supervised Learning Framework for Human-Centric Visual Tasks

要約 人間中心の視覚タスクは、その広範なアプリケーションにより、研究の注目を集め … 続きを読む

カテゴリー: cs.CV | Beyond Appearance: a Semantic Controllable Self-Supervised Learning Framework for Human-Centric Visual Tasks はコメントを受け付けていません

SparseViT: Revisiting Activation Sparsity for Efficient High-Resolution Vision Transformer

要約 高解像度の画像により、ニューラル ネットワークはより豊かな視覚的表現を学習 … 続きを読む

カテゴリー: cs.CV | SparseViT: Revisiting Activation Sparsity for Efficient High-Resolution Vision Transformer はコメントを受け付けていません