cs.AI」カテゴリーアーカイブ

Deep Compression Autoencoder for Efficient High-Resolution Diffusion Models

要約 高解像度拡散モデルを加速するための新しいオートエンコーダー モデル ファミ … 続きを読む

カテゴリー: cs.AI, cs.CV | Deep Compression Autoencoder for Efficient High-Resolution Diffusion Models はコメントを受け付けていません

OmniEdit: Building Image Editing Generalist Models Through Specialist Supervision

要約 命令ガイド付き画像編集方法は、自動的に合成された、または手動で注釈が付けら … 続きを読む

カテゴリー: cs.AI, cs.CV | OmniEdit: Building Image Editing Generalist Models Through Specialist Supervision はコメントを受け付けていません

Grounding Video Models to Actions through Goal Conditioned Exploration

要約 大量のインターネット ビデオで事前トレーニングされた大規模なビデオ モデル … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Grounding Video Models to Actions through Goal Conditioned Exploration はコメントを受け付けていません

INQUIRE: A Natural World Text-to-Image Retrieval Benchmark

要約 INQUIRE は、専門家レベルのクエリでマルチモーダルなビジョン言語モデ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.IR | INQUIRE: A Natural World Text-to-Image Retrieval Benchmark はコメントを受け付けていません

Add-it: Training-Free Object Insertion in Images With Pretrained Diffusion Models

要約 テキストの指示に基づいて画像にオブジェクトを追加することは、セマンティック … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG | Add-it: Training-Free Object Insertion in Images With Pretrained Diffusion Models はコメントを受け付けていません

BehaviorGPT: Smart Agent Simulation for Autonomous Driving with Next-Patch Prediction

要約 交通エージェントの現実的な動作をシミュレーションすることは、自動運転システ … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | BehaviorGPT: Smart Agent Simulation for Autonomous Driving with Next-Patch Prediction はコメントを受け付けていません

Video-Language Critic: Transferable Reward Functions for Language-Conditioned Robotics

要約 自然言語は、多くの場合、人間がロボットのタスクを指定するための最も簡単で便 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | Video-Language Critic: Transferable Reward Functions for Language-Conditioned Robotics はコメントを受け付けていません

Consciousness is entailed by compositional learning of new causal structures in deep predictive processing systems

要約 機械学習アルゴリズムは、特定の複雑な領域で超人的なパフォーマンスを達成しま … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.NE, cs.RO, q-bio.NC | Consciousness is entailed by compositional learning of new causal structures in deep predictive processing systems はコメントを受け付けていません

Real-World Offline Reinforcement Learning from Vision Language Model Feedback

要約 オフライン強化学習により、オンラインでの対話なしで、事前に収集された次善の … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Real-World Offline Reinforcement Learning from Vision Language Model Feedback はコメントを受け付けていません

BehaviorGPT: Smart Agent Simulation for Autonomous Driving with Next-Patch Prediction

要約 自動運転システムの安全性を効率的に検証するには、交通エージェント間の現実的 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | BehaviorGPT: Smart Agent Simulation for Autonomous Driving with Next-Patch Prediction はコメントを受け付けていません