cs.AI」カテゴリーアーカイブ

AKiRa: Augmentation Kit on Rays for optical video generation

要約 テキスト条件付きビデオの普及における最近の進歩により、ビデオの品質は大幅に … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | AKiRa: Augmentation Kit on Rays for optical video generation はコメントを受け付けていません

VideoDPO: Omni-Preference Alignment for Video Diffusion Generation

要約 生成拡散モデルの最近の進歩により、テキストからビデオへの生成が大幅に進歩し … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | VideoDPO: Omni-Preference Alignment for Video Diffusion Generation はコメントを受け付けていません

E-CAR: Efficient Continuous Autoregressive Image Generation via Multistage Modeling

要約 画像生成用の連続トークンを使用した自己回帰 (AR) モデルの最近の進歩に … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | E-CAR: Efficient Continuous Autoregressive Image Generation via Multistage Modeling はコメントを受け付けていません

Learning from Massive Human Videos for Universal Humanoid Pose Control

要約 ヒューマノイド ロボットのスケーラブルな学習は、現実世界のアプリケーション … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.RO | Learning from Massive Human Videos for Universal Humanoid Pose Control はコメントを受け付けていません

Walk Wisely on Graph: Knowledge Graph Reasoning with Dual Agents via Efficient Guidance-Exploration

要約 近年、マルチホップ推論は、その有効性と解釈可能性により、ナレッジグラフ(K … 続きを読む

カテゴリー: cs.AI, cs.LG | Walk Wisely on Graph: Knowledge Graph Reasoning with Dual Agents via Efficient Guidance-Exploration はコメントを受け付けていません

Two Layer Walk: A Community-Aware Graph Embedding

要約 コミュニティ構造は、ネットワークのメゾスコピックな組織を理解し、ローカルと … 続きを読む

カテゴリー: cs.AI, cs.SI | Two Layer Walk: A Community-Aware Graph Embedding はコメントを受け付けていません

Are Your LLMs Capable of Stable Reasoning?

要約 大規模言語モデル (LLM) の急速な進歩により、複雑な推論タスクにおける … 続きを読む

カテゴリー: cs.AI, cs.CL | Are Your LLMs Capable of Stable Reasoning? はコメントを受け付けていません

SafeAgentBench: A Benchmark for Safe Task Planning of Embodied LLM Agents

要約 大規模言語モデル (LLM) の統合により、身体化エージェントは自然言語で … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.RO | SafeAgentBench: A Benchmark for Safe Task Planning of Embodied LLM Agents はコメントを受け付けていません

Lifting Scheme-Based Implicit Disentanglement of Emotion-Related Facial Dynamics in the Wild

要約 実際の動的表情認識 (DFER) は、感情に関連した表情を認識する際に大き … 続きを読む

カテゴリー: cs.AI, cs.CV | Lifting Scheme-Based Implicit Disentanglement of Emotion-Related Facial Dynamics in the Wild はコメントを受け付けていません

Multi-Object Graph Affordance Network: Goal-Oriented Planning through Learned Compound Object Affordances

要約 学習オブジェクト アフォーダンスは、ロボット学習の分野で効果的なツールです … 続きを読む

カテゴリー: cs.AI, cs.RO | Multi-Object Graph Affordance Network: Goal-Oriented Planning through Learned Compound Object Affordances はコメントを受け付けていません