「cs.AI」カテゴリーアーカイブ

AKiRa: Augmentation Kit on Rays for optical video generation

投稿日: 2024年12月19日作成者: jarxiv

要約テキスト条件付きビデオの普及における最近の進歩により、ビデオの品質は大幅に … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM | コメントを受け付けていません

VideoDPO: Omni-Preference Alignment for Video Diffusion Generation

投稿日: 2024年12月19日作成者: jarxiv

要約生成拡散モデルの最近の進歩により、テキストからビデオへの生成が大幅に進歩し … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

E-CAR: Efficient Continuous Autoregressive Image Generation via Multistage Modeling

投稿日: 2024年12月19日作成者: jarxiv

要約画像生成用の連続トークンを使用した自己回帰 (AR) モデルの最近の進歩に … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Learning from Massive Human Videos for Universal Humanoid Pose Control

投稿日: 2024年12月19日作成者: jarxiv

要約ヒューマノイドロボットのスケーラブルな学習は、現実世界のアプリケーション … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.RO | コメントを受け付けていません

Walk Wisely on Graph: Knowledge Graph Reasoning with Dual Agents via Efficient Guidance-Exploration

投稿日: 2024年12月19日作成者: jarxiv

要約近年、マルチホップ推論は、その有効性と解釈可能性により、ナレッジグラフ（K … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Two Layer Walk: A Community-Aware Graph Embedding

投稿日: 2024年12月19日作成者: jarxiv

要約コミュニティ構造は、ネットワークのメゾスコピックな組織を理解し、ローカルと … 続きを読む →

カテゴリー: cs.AI, cs.SI | コメントを受け付けていません

Are Your LLMs Capable of Stable Reasoning?

投稿日: 2024年12月19日作成者: jarxiv

要約大規模言語モデル (LLM) の急速な進歩により、複雑な推論タスクにおける … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

SafeAgentBench: A Benchmark for Safe Task Planning of Embodied LLM Agents

投稿日: 2024年12月19日作成者: jarxiv

要約大規模言語モデル (LLM) の統合により、身体化エージェントは自然言語で … 続きを読む →

カテゴリー: cs.AI, cs.CR, cs.RO | コメントを受け付けていません

Lifting Scheme-Based Implicit Disentanglement of Emotion-Related Facial Dynamics in the Wild

投稿日: 2024年12月19日作成者: jarxiv

要約実際の動的表情認識 (DFER) は、感情に関連した表情を認識する際に大き … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Multi-Object Graph Affordance Network: Goal-Oriented Planning through Learned Compound Object Affordances

投稿日: 2024年12月18日作成者: jarxiv

要約学習オブジェクトアフォーダンスは、ロボット学習の分野で効果的なツールです … 続きを読む →

カテゴリー: cs.AI, cs.RO | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

AKiRa: Augmentation Kit on Rays for optical video generation

VideoDPO: Omni-Preference Alignment for Video Diffusion Generation

E-CAR: Efficient Continuous Autoregressive Image Generation via Multistage Modeling

Learning from Massive Human Videos for Universal Humanoid Pose Control

Walk Wisely on Graph: Knowledge Graph Reasoning with Dual Agents via Efficient Guidance-Exploration

Two Layer Walk: A Community-Aware Graph Embedding

Are Your LLMs Capable of Stable Reasoning?

SafeAgentBench: A Benchmark for Safe Task Planning of Embodied LLM Agents

Lifting Scheme-Based Implicit Disentanglement of Emotion-Related Facial Dynamics in the Wild

Multi-Object Graph Affordance Network: Goal-Oriented Planning through Learned Compound Object Affordances

最近の投稿

最近のコメント

アーカイブ

カテゴリー