-
最近の投稿
- 3D-AffordanceLLM: Harnessing Large Language Models for Open-Vocabulary Affordance Detection in 3D Worlds
- Towards Generalizable Vision-Language Robotic Manipulation: A Benchmark and LLM-guided 3D Policy
- Haptic-ACT: Bridging Human Intuition with Compliant Robotic Manipulation via Immersive VR
- Task-Aware Robotic Grasping by evaluating Quality Diversity Solutions through Foundation Models
- VDT-Auto: End-to-end Autonomous Driving with VLM-Guided Diffusion Transformers
-
最近のコメント
表示できるコメントはありません。 cs.AI (34550) cs.CL (26107) cs.CR (2648) cs.CV (40395) cs.LG (39550) cs.RO (20192) cs.SY (3066) eess.IV (4803) eess.SY (3060) stat.ML (5206)
月別アーカイブ: 2022年7月
Compositional Visual Generation with Composable Diffusion Models
要約 DALLE-2などの大規模なテキストガイド拡散モデルは、自然言語の説明が与 … 続きを読む
Adaptive Token Sampling For Efficient Vision Transformers
要約 最先端のビジョントランスフォーマーモデルは、画像分類で有望な結果を達成しま … 続きを読む
カテゴリー: cs.CV
Adaptive Token Sampling For Efficient Vision Transformers はコメントを受け付けていません
Task Agnostic and Post-hoc Unseen Distribution Detection
要約 分布外(OOD)検出、異常検出、および不確実性推定タスクの最近の進歩にもか … 続きを読む
Group DETR: Fast Training Convergence with Decoupled One-to-Many Label Assignment
要約 Detection Transformer(DETR)は、1対1のラベル割 … 続きを読む
カテゴリー: cs.CV
Group DETR: Fast Training Convergence with Decoupled One-to-Many Label Assignment はコメントを受け付けていません
Domain Decorrelation with Potential Energy Ranking
要約 機械学習システム、特に深層学習に基づく方法は、実験的な設定の下で最新のコン … 続きを読む
カテゴリー: cs.CV
Domain Decorrelation with Potential Energy Ranking はコメントを受け付けていません
Dynamic Channel Selection in Self-Supervised Learning
要約 自己監視アプローチを使用して構築されたコンピュータビジョンモデルは現在では … 続きを読む
カテゴリー: cs.CV
Dynamic Channel Selection in Self-Supervised Learning はコメントを受け付けていません
Intention-Conditioned Long-Term Human Egocentric Action Forecasting @ EGO4D Challenge 2022
要約 人間が将来どのように行動するかを予測するには、人間を特定の目標に導くため、 … 続きを読む
カテゴリー: cs.CV
Intention-Conditioned Long-Term Human Egocentric Action Forecasting @ EGO4D Challenge 2022 はコメントを受け付けていません
Exploring the Semi-supervised Video Object Segmentation Problem from a Cyclic Perspective
要約 最新のビデオオブジェクトセグメンテーション(VOS)アルゴリズムは、順次処 … 続きを読む
カテゴリー: cs.CV
Exploring the Semi-supervised Video Object Segmentation Problem from a Cyclic Perspective はコメントを受け付けていません
IGFormer: Interaction Graph Transformer for Skeleton-based Human Interaction Recognition
要約 人間の相互作用の認識は、多くのアプリケーションで非常に重要です。 相互作用 … 続きを読む
カテゴリー: cs.CV
IGFormer: Interaction Graph Transformer for Skeleton-based Human Interaction Recognition はコメントを受け付けていません
Is GPT-3 all you need for Visual Question Answering in Cultural Heritage?
要約 文化遺産ドメインでのディープラーニングとコンピュータービジョンの使用は、オ … 続きを読む