月別アーカイブ: 2024年2月

NeRF Analogies: Example-Based Visual Attribute Transfer for NeRFs

要約 Neural Radiance Field (NeRF) は、3D ジオメ … 続きを読む

カテゴリー: cs.CV | NeRF Analogies: Example-Based Visual Attribute Transfer for NeRFs はコメントを受け付けていません

Vision-Language Models Provide Promptable Representations for Reinforcement Learning

要約 人間は背景世界の知識を活用することで、新しい行動を素早く学習できます。 対 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Vision-Language Models Provide Promptable Representations for Reinforcement Learning はコメントを受け付けていません

BdSLW60: A Word-Level Bangla Sign Language Dataset

要約 手話による会話は、聴覚障害者にとって日常のコミュニケーションに不可欠な手段 … 続きを読む

カテゴリー: cs.CV | BdSLW60: A Word-Level Bangla Sign Language Dataset はコメントを受け付けていません

Learned Image Compression with Text Quality Enhancement

要約 学習された画像圧縮は、超低ビットレートを効率的に達成できるため、広く普及し … 続きを読む

カテゴリー: cs.CV, cs.LG | Learned Image Compression with Text Quality Enhancement はコメントを受け付けていません

Peeking Behind the Curtains of Residual Learning

要約 残差学習の利用は、深くてスケーラブルなニューラル ネットワークで広く普及し … 続きを読む

カテゴリー: cs.CV, cs.LG | Peeking Behind the Curtains of Residual Learning はコメントを受け付けていません

Learning Continuous 3D Words for Text-to-Image Generation

要約 画像生成のための拡散モデルに対する現在の制御(テキストや ControlN … 続きを読む

カテゴリー: cs.CV | Learning Continuous 3D Words for Text-to-Image Generation はコメントを受け付けていません

PIN: Positional Insert Unlocks Object Localisation Abilities in VLMs

要約 Flamingo や GPT-4V などのビジョン言語モデル (VLM) … 続きを読む

カテゴリー: cs.CV | PIN: Positional Insert Unlocks Object Localisation Abilities in VLMs はコメントを受け付けていません

Are Semi-Dense Detector-Free Methods Good at Matching Local Features?

要約 LoFTR などの準高密度検出器を使用しないアプローチ (SDF) は、現 … 続きを読む

カテゴリー: cs.AI, cs.CV | Are Semi-Dense Detector-Free Methods Good at Matching Local Features? はコメントを受け付けていません

Mitigating Object Hallucination in Large Vision-Language Models via Classifier-Free Guidance

要約 Large Vision-Language Model (LVLM) の進 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Mitigating Object Hallucination in Large Vision-Language Models via Classifier-Free Guidance はコメントを受け付けていません

IM-3D: Iterative Multiview Diffusion and Reconstruction for High-Quality 3D Generation

要約 ほとんどの text-to-image ジェネレーターは、数十億の画像でト … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | IM-3D: Iterative Multiview Diffusion and Reconstruction for High-Quality 3D Generation はコメントを受け付けていません