月別アーカイブ: 2025年2月

Exploring Advanced Techniques for Visual Question Answering: A Comprehensive Comparison

要約 視覚的な質問応答(VQA)は、コンピュータービジョンと自然言語処理の交差点 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.ET, cs.LG | Exploring Advanced Techniques for Visual Question Answering: A Comprehensive Comparison はコメントを受け付けていません

Improving the Diffusability of Autoencoders

要約 潜在的な拡散モデルは、高品質の画像とビデオを生成するための主要なアプローチ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Improving the Diffusability of Autoencoders はコメントを受け付けていません

LongWriter-V: Enabling Ultra-Long and High-Fidelity Generation in Vision-Language Models

要約 既存の大きなビジョン言語モデル(LVLMS)は、最大128Kの視覚的および … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | LongWriter-V: Enabling Ultra-Long and High-Fidelity Generation in Vision-Language Models はコメントを受け付けていません

Dynamic Concepts Personalization from Single Videos

要約 生成的なテキストから画像へのパーソナライズモデルをパーソナライズすると、驚 … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.LG | Dynamic Concepts Personalization from Single Videos はコメントを受け付けていません

Scaling Text-Rich Image Understanding via Code-Guided Synthetic Multimodal Data Generation

要約 チャートやドキュメントなどの豊富なテキストを持つ画像に関する推論は、ビジョ … 続きを読む

カテゴリー: cs.CL, cs.CV | Scaling Text-Rich Image Understanding via Code-Guided Synthetic Multimodal Data Generation はコメントを受け付けていません

VidStyleODE: Disentangled Video Editing via StyleGAN and NeuralODEs

要約 $ \ textbf {vidstyleode} $を提案します。 生成敵 … 続きを読む

カテゴリー: cs.CV | VidStyleODE: Disentangled Video Editing via StyleGAN and NeuralODEs はコメントを受け付けていません

Benchmarking Multimodal RAG through a Chart-based Document Question-Answering Generation Framework

要約 マルチモーダル検索の高等世代(MRAG)は、外部の知識を統合することにより … 続きを読む

カテゴリー: cs.AI, cs.CV | Benchmarking Multimodal RAG through a Chart-based Document Question-Answering Generation Framework はコメントを受け付けていません

Time Travel: A Comprehensive Benchmark to Evaluate LMMs on Historical and Cultural Artifacts

要約 歴史的および文化的アーティファクトを理解するには、人間の専門知識と高度な計 … 続きを読む

カテゴリー: cs.CV, cs.LG | Time Travel: A Comprehensive Benchmark to Evaluate LMMs on Historical and Cultural Artifacts はコメントを受け付けていません

Muscle Activation Estimation by Optimizing the Musculoskeletal Model for Personalized Strength and Conditioning Training

要約 筋骨格モデルは、筋肉の状態を分析するために、リハビリテーションとレジスタン … 続きを読む

カテゴリー: cs.RO, physics.med-ph | Muscle Activation Estimation by Optimizing the Musculoskeletal Model for Personalized Strength and Conditioning Training はコメントを受け付けていません

Neural Green’s Operators for Parametric Partial Differential Equations

要約 この作業では、線形部分微分方程式(PDE)のパラメトリックファミリーのソリ … 続きを読む

カテゴリー: 68T07, cs.LG, cs.NA, G.1.8, math.NA | Neural Green’s Operators for Parametric Partial Differential Equations はコメントを受け付けていません