cs.MM」カテゴリーアーカイブ

SPRING: Situated Conversation Agent Pretrained with Multimodal Questions from Incremental Layout Graph

要約 既存のマルチモーダル会話エージェントは、単純なシナリオでは絶対位置の特定や … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | SPRING: Situated Conversation Agent Pretrained with Multimodal Questions from Incremental Layout Graph はコメントを受け付けていません

Attention-Aware Anime Line Drawing Colorization

要約 近年、アニメの線画の自動着色は、アニメ産業に多大な利益をもたらすことから注 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.MM | Attention-Aware Anime Line Drawing Colorization はコメントを受け付けていません

Applicability limitations of differentiable full-reference image-quality

要約 画像処理アプリケーションの開発において、主観的な画質測定は重要な役割を担っ … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.MM, eess.IV, I.4.0 | Applicability limitations of differentiable full-reference image-quality はコメントを受け付けていません

Training Vision-Language Transformers from Captions Alone

要約 Vision-Language Transformersは、人間のラベル( … 続きを読む

カテゴリー: cs.CV, cs.MM | Training Vision-Language Transformers from Captions Alone はコメントを受け付けていません

HiTeA: Hierarchical Temporal-Aware Video-Language Pre-training

要約 ビデオ言語の事前トレーニングにより、下流のさまざまなビデオ言語タスクのパフ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.MM | HiTeA: Hierarchical Temporal-Aware Video-Language Pre-training はコメントを受け付けていません

Learning to Estimate 3D Human Pose from Point Cloud

要約 3D 姿勢推定は、コンピューター ビジョンにおける困難な問題です。 既存の … 続きを読む

カテゴリー: cs.CV, cs.MM | Learning to Estimate 3D Human Pose from Point Cloud はコメントを受け付けていません

Generative Colorization of Structured Mobile Web Pages

要約 色は Web ページの重要なデザイン要素であり、閲覧者の感情や Web サ … 続きを読む

カテゴリー: cs.CV, cs.MM | Generative Colorization of Structured Mobile Web Pages はコメントを受け付けていません

MMDialog: A Large-scale Multi-turn Dialogue Dataset Towards Multi-modal Open-domain Conversation

要約 マルチモーダル コンテンツで応答することは、インテリジェントな会話型エージ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | MMDialog: A Large-scale Multi-turn Dialogue Dataset Towards Multi-modal Open-domain Conversation はコメントを受け付けていません

From Images to Textual Prompts: Zero-shot VQA with Frozen Large Language Models

要約 大規模言語モデル (LLM) は、新しい言語タスクに対する優れたゼロショッ … 続きを読む

カテゴリー: cs.CV, cs.MM | From Images to Textual Prompts: Zero-shot VQA with Frozen Large Language Models はコメントを受け付けていません

Attention-Aware Anime Line Drawing Colorization

要約 アニメの線画の自動彩色は、アニメ業界に大きなメリットをもたらすことから、近 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.MM | Attention-Aware Anime Line Drawing Colorization はコメントを受け付けていません