月別アーカイブ: 2023年5月

Self-Chained Image-Language Model for Video Localization and Question Answering

要約 タイトル:ビデオのローカリゼーションと質問回答のためのセルフチェーンドイメ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Self-Chained Image-Language Model for Video Localization and Question Answering はコメントを受け付けていません

Region-Aware Pretraining for Open-Vocabulary Object Detection with Vision Transformers

要約 タイトル:Vision Transformerを用いた開放ボキャブラリー物 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Region-Aware Pretraining for Open-Vocabulary Object Detection with Vision Transformers はコメントを受け付けていません

Virtual Occlusions Through Implicit Depth

要約 タイトル: 暗黙的な深度による仮想遮蔽 要約: – 拡張現実( … 続きを読む

カテゴリー: cs.CV | Virtual Occlusions Through Implicit Depth はコメントを受け付けていません

Exploiting Diffusion Prior for Real-World Image Super-Resolution

要約 タイトル:実世界の画像スーパーレゾリューションのための拡散事前知識の活用 … 続きを読む

カテゴリー: cs.CV | Exploiting Diffusion Prior for Real-World Image Super-Resolution はコメントを受け付けていません

An Inverse Scaling Law for CLIP Training

要約 【タイトル】CLIPトレーニングにおける逆スケーリング則 【要約】 &#8 … 続きを読む

カテゴリー: cs.CV | An Inverse Scaling Law for CLIP Training はコメントを受け付けていません

Musketeer (All for One, and One for All): A Generalist Vision-Language Model with Task Explanation Prompts

要約 タイトル:Musketeer(一方の為に、そして全ての為に):タスク説明提 … 続きを読む

カテゴリー: cs.CV | Musketeer (All for One, and One for All): A Generalist Vision-Language Model with Task Explanation Prompts はコメントを受け付けていません

Simple Token-Level Confidence Improves Caption Correctness

要約 タイトル:トークンレベル信頼度の単純な改善がキャプションの正確性を向上させ … 続きを読む

カテゴリー: cs.CV | Simple Token-Level Confidence Improves Caption Correctness はコメントを受け付けていません

SparseGNV: Generating Novel Views of Indoor Scenes with Sparse Input Views

要約 タイトル:SparseGNV:疎な入力視点で室内シーンの新しい視点を生成す … 続きを読む

カテゴリー: cs.CV | SparseGNV: Generating Novel Views of Indoor Scenes with Sparse Input Views はコメントを受け付けていません

Decentralization and Acceleration Enables Large-Scale Bundle Adjustment

要約 タイトル:Decentralization and Acceleratio … 続きを読む

カテゴリー: cs.CV, cs.RO, math.OC | Decentralization and Acceleration Enables Large-Scale Bundle Adjustment はコメントを受け付けていません

EfficientViT: Memory Efficient Vision Transformer with Cascaded Group Attention

要約 タイトル: Cascade Group Attentionを用いたメモリー … 続きを読む

カテゴリー: cs.CV | EfficientViT: Memory Efficient Vision Transformer with Cascaded Group Attention はコメントを受け付けていません