月別アーカイブ: 2022年7月

Compositional Visual Generation with Composable Diffusion Models

要約 DALLE-2などの大規模なテキストガイド拡散モデルは、自然言語の説明が与 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Compositional Visual Generation with Composable Diffusion Models はコメントを受け付けていません

Adaptive Token Sampling For Efficient Vision Transformers

要約 最先端のビジョントランスフォーマーモデルは、画像分類で有望な結果を達成しま … 続きを読む

カテゴリー: cs.CV | Adaptive Token Sampling For Efficient Vision Transformers はコメントを受け付けていません

Task Agnostic and Post-hoc Unseen Distribution Detection

要約 分布外(OOD)検出、異常検出、および不確実性推定タスクの最近の進歩にもか … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Task Agnostic and Post-hoc Unseen Distribution Detection はコメントを受け付けていません

Group DETR: Fast Training Convergence with Decoupled One-to-Many Label Assignment

要約 Detection Transformer(DETR)は、1対1のラベル割 … 続きを読む

カテゴリー: cs.CV | Group DETR: Fast Training Convergence with Decoupled One-to-Many Label Assignment はコメントを受け付けていません

Domain Decorrelation with Potential Energy Ranking

要約 機械学習システム、特に深層学習に基づく方法は、実験的な設定の下で最新のコン … 続きを読む

カテゴリー: cs.CV | Domain Decorrelation with Potential Energy Ranking はコメントを受け付けていません

Dynamic Channel Selection in Self-Supervised Learning

要約 自己監視アプローチを使用して構築されたコンピュータビジョンモデルは現在では … 続きを読む

カテゴリー: cs.CV | Dynamic Channel Selection in Self-Supervised Learning はコメントを受け付けていません

Intention-Conditioned Long-Term Human Egocentric Action Forecasting @ EGO4D Challenge 2022

要約 人間が将来どのように行動するかを予測するには、人間を特定の目標に導くため、 … 続きを読む

カテゴリー: cs.CV | Intention-Conditioned Long-Term Human Egocentric Action Forecasting @ EGO4D Challenge 2022 はコメントを受け付けていません

Exploring the Semi-supervised Video Object Segmentation Problem from a Cyclic Perspective

要約 最新のビデオオブジェクトセグメンテーション(VOS)アルゴリズムは、順次処 … 続きを読む

カテゴリー: cs.CV | Exploring the Semi-supervised Video Object Segmentation Problem from a Cyclic Perspective はコメントを受け付けていません

IGFormer: Interaction Graph Transformer for Skeleton-based Human Interaction Recognition

要約 人間の相互作用の認識は、多くのアプリケーションで非常に重要です。 相互作用 … 続きを読む

カテゴリー: cs.CV | IGFormer: Interaction Graph Transformer for Skeleton-based Human Interaction Recognition はコメントを受け付けていません

Is GPT-3 all you need for Visual Question Answering in Cultural Heritage?

要約 文化遺産ドメインでのディープラーニングとコンピュータービジョンの使用は、オ … 続きを読む

カテゴリー: cs.CL, cs.CV | Is GPT-3 all you need for Visual Question Answering in Cultural Heritage? はコメントを受け付けていません