cs.LG」カテゴリーアーカイブ

A Trust-Guided Approach to MR Image Reconstruction with Side Information

要約 MRI スキャン時間を短縮すると、患者ケアが改善され、医療費が削減されます … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | A Trust-Guided Approach to MR Image Reconstruction with Side Information はコメントを受け付けていません

Through-The-Mask: Mask-based Motion Trajectories for Image-to-Video Generation

要約 ここでは、テキストによる説明に基づいて静止画像をリアルなビデオ シーケンス … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Through-The-Mask: Mask-based Motion Trajectories for Image-to-Video Generation はコメントを受け付けていません

Reconstruction vs. Generation: Taming Optimization Dilemma in Latent Diffusion Models

要約 Transformer アーキテクチャを備えた潜在拡散モデルは、高忠実度の … 続きを読む

カテゴリー: cs.CV, cs.LG | Reconstruction vs. Generation: Taming Optimization Dilemma in Latent Diffusion Models はコメントを受け付けていません

Geometry Restoration and Dewarping of Camera-Captured Document Images

要約 この研究は、検出、セグメンテーション、ジオメトリ復元、歪み補正のアルゴリズ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Geometry Restoration and Dewarping of Camera-Captured Document Images はコメントを受け付けていません

Large language models for artificial general intelligence (AGI): A survey of foundational principles and approaches

要約 視覚言語モデル、大規模言語モデル (LLM)、拡散モデル、視覚言語行動 ( … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Large language models for artificial general intelligence (AGI): A survey of foundational principles and approaches はコメントを受け付けていません

ICONS: Influence Consensus for Vision-Language Data Selection

要約 視覚的命令の調整には通常、大量の視覚言語トレーニング データが必要です。 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | ICONS: Influence Consensus for Vision-Language Data Selection はコメントを受け付けていません

Rate-My-LoRA: Efficient and Adaptive Federated Model Tuning for Cardiac MRI Segmentation

要約 心血管疾患 (CVD) と心臓の同期不全は、米国の主要な公衆衛生上の問題で … 続きを読む

カテゴリー: cs.CV, cs.DC, cs.LG | Rate-My-LoRA: Efficient and Adaptive Federated Model Tuning for Cardiac MRI Segmentation はコメントを受け付けていません

Automated Generation of Challenging Multiple-Choice Questions for Vision Language Model Evaluation

要約 ビジョン言語モデル (VLM) の迅速な開発には、厳密で信頼性の高い評価が … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.CY, cs.LG | Automated Generation of Challenging Multiple-Choice Questions for Vision Language Model Evaluation はコメントを受け付けていません

QuArch: A Question-Answering Dataset for AI Agents in Computer Architecture

要約 QuArch は、言語モデルによるコンピューター アーキテクチャの理解を評 … 続きを読む

カテゴリー: cs.AI, cs.AR, cs.LG | QuArch: A Question-Answering Dataset for AI Agents in Computer Architecture はコメントを受け付けていません

MixGCN: Scalable GCN Training by Mixture of Parallelism and Mixture of Accelerators

要約 グラフ畳み込みネットワーク (GCN) は、グラフベースの学習タスクにおい … 続きを読む

カテゴリー: cs.AI, cs.LG | MixGCN: Scalable GCN Training by Mixture of Parallelism and Mixture of Accelerators はコメントを受け付けていません