月別アーカイブ: 2024年5月

MetaToken: Detecting Hallucination in Image Descriptions by Meta Classification

要約 Large Vision Language Model (LVLM) は、 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG, I.4 | MetaToken: Detecting Hallucination in Image Descriptions by Meta Classification はコメントを受け付けていません

LOGO: Video Text Spotting with Language Collaboration and Glyph Perception Model

要約 ビデオ テキスト スポッティングは、ビデオ内のテキスト インスタンスのロー … 続きを読む

カテゴリー: cs.CV | LOGO: Video Text Spotting with Language Collaboration and Glyph Perception Model はコメントを受け付けていません

Going beyond compositional generalization, DDPMs can produce zero-shot interpolation

要約 ノイズ除去拡散確率モデル (DDPM) は画像生成において顕著な機能を示し … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.NE | Going beyond compositional generalization, DDPMs can produce zero-shot interpolation はコメントを受け付けていません

$E^{3}$Gen: Efficient, Expressive and Editable Avatars Generation

要約 このペーパーは、効率的で表現力豊かで編集可能なデジタル アバターを生成する … 続きを読む

カテゴリー: cs.CV | $E^{3}$Gen: Efficient, Expressive and Editable Avatars Generation はコメントを受け付けていません

Contrastive-Adversarial and Diffusion: Exploring pre-training and fine-tuning strategies for sulcal identification

要約 過去 10 年間、コンピューター ビジョンでは、さまざまなトレーニングと学 … 続きを読む

カテゴリー: cs.CV, eess.IV | Contrastive-Adversarial and Diffusion: Exploring pre-training and fine-tuning strategies for sulcal identification はコメントを受け付けていません

VideoTree: Adaptive Tree-based Video Representation for LLM Reasoning on Long Videos

要約 ビデオ言語を理解するタスクは短いビデオ クリップに焦点を当てており、多くの … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | VideoTree: Adaptive Tree-based Video Representation for LLM Reasoning on Long Videos はコメントを受け付けていません

REBEL: Reinforcement Learning via Regressing Relative Rewards

要約 近接ポリシー最適化 (PPO) は、もともと連続制御問題のために開発されま … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | REBEL: Reinforcement Learning via Regressing Relative Rewards はコメントを受け付けていません

Intelligent Anomaly Detection for Lane Rendering Using Transformer with Self-Supervised Pre-Training and Customized Fine-Tuning

要約 デジタル地図を使用したナビゲーション サービスの急増は、ドライバーに大きな … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, eess.IV, stat.ML | Intelligent Anomaly Detection for Lane Rendering Using Transformer with Self-Supervised Pre-Training and Customized Fine-Tuning はコメントを受け付けていません

Towards Global Glacier Mapping with Deep Learning and Open Earth Observation Data

要約 地球規模の氷河の正確なマッピングは、気候変動の影響を理解するために不可欠で … 続きを読む

カテゴリー: cs.CV, cs.LG | Towards Global Glacier Mapping with Deep Learning and Open Earth Observation Data はコメントを受け付けていません

A study on the adequacy of common IQA measures for medical images

要約 画質評価 (IQA) は、画像を操作する新しい機械学習アルゴリズムの開発段 … 続きを読む

カテゴリー: cs.CV, eess.IV | A study on the adequacy of common IQA measures for medical images はコメントを受け付けていません