cs.LG」カテゴリーアーカイブ

It’s All Connected: A Journey Through Test-Time Memorization, Attentional Bias, Retention, and Online Optimization

要約 効率的かつ効果的な建築バックボーンの設計は、基礎モデルの能力を高めるための … 続きを読む

カテゴリー: cs.AI, cs.LG | It’s All Connected: A Journey Through Test-Time Memorization, Attentional Bias, Retention, and Online Optimization はコメントを受け付けていません

Rethinking Few-Shot Image Fusion: Granular Ball Priors Enable General-Purpose Deep Fusion

要約 画像融合タスクでは、プライアーとしての実際の融合画像が存在しないことは、基 … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.LG, eess.IV, stat.ML | Rethinking Few-Shot Image Fusion: Granular Ball Priors Enable General-Purpose Deep Fusion はコメントを受け付けていません

A Coding-Theoretic Analysis of Hyperspherical Prototypical Learning Geometry

要約 Hyperspherical Prototypical Learning( … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, eess.SP, stat.ML | A Coding-Theoretic Analysis of Hyperspherical Prototypical Learning Geometry はコメントを受け付けていません

CDXLSTM: Boosting Remote Sensing Change Detection with Extended Long Short-Term Memory

要約 複雑なシーンやさまざまな条件では、変化を正確に識別するためには、空間的コン … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | CDXLSTM: Boosting Remote Sensing Change Detection with Extended Long Short-Term Memory はコメントを受け付けていません

ArtistAuditor: Auditing Artist Style Pirate in Text-to-Image Generation Models

要約 Dall-E、安定した拡散、Midjourneyなどの拡散プロセスに基づい … 続きを読む

カテゴリー: cs.CR, cs.CV, cs.LG | ArtistAuditor: Auditing Artist Style Pirate in Text-to-Image Generation Models はコメントを受け付けていません

VistaDPO: Video Hierarchical Spatial-Temporal Direct Preference Optimization for Large Video Models

要約 大規模な言語モデル(LLM)に基づいて構築された大規模なビデオモデル(LV … 続きを読む

カテゴリー: cs.CV, cs.LG | VistaDPO: Video Hierarchical Spatial-Temporal Direct Preference Optimization for Large Video Models はコメントを受け付けていません

Science-T2I: Addressing Scientific Illusions in Image Synthesis

要約 科学的知識を生成モデルに統合し、画像統合のリアリズムと一貫性を高めるための … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Science-T2I: Addressing Scientific Illusions in Image Synthesis はコメントを受け付けていません

PerceptionLM: Open-Access Data and Models for Detailed Visual Understanding

要約 ビジョン言語モデルはコンピュータービジョンの研究に不可欠ですが、多くの高性 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | PerceptionLM: Open-Access Data and Models for Detailed Visual Understanding はコメントを受け付けていません

Know Where You’re Uncertain When Planning with Multimodal Foundation Models: A Formal Framework

要約 マルチモーダルファンデーションモデルは、実行可能な計画を生成するために感覚 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Know Where You’re Uncertain When Planning with Multimodal Foundation Models: A Formal Framework はコメントを受け付けていません

LANGTRAJ: Diffusion Model and Dataset for Language-Conditioned Trajectory Simulation

要約 制御可能性を備えた自律車両を評価することで、反事実または構造化された設定で … 続きを読む

カテゴリー: cs.LG, cs.RO, I.2.6 | LANGTRAJ: Diffusion Model and Dataset for Language-Conditioned Trajectory Simulation はコメントを受け付けていません