月別アーカイブ: 2025年3月

Scale-wise Distillation of Diffusion Models

投稿日: 2025年3月21日作成者: jarxiv

要約 SWDは、拡散ベースの少ないステップジェネレーターの次のスケール予測アイデ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

SA-Occ: Satellite-Assisted 3D Occupancy Prediction in Real World

投稿日: 2025年3月21日作成者: jarxiv

要約既存のビジョンベースの3D占有予測法は、衛星ビューを組み込むことの潜在的な … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Wolf: Dense Video Captioning with a World Summarization Framework

投稿日: 2025年3月21日作成者: jarxiv

要約正確なビデオキャプションのための世界要約フレームワークであるWolfを提案 … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG | コメントを受け付けていません

VerbDiff: Text-Only Diffusion Models with Enhanced Interaction Awareness

投稿日: 2025年3月21日作成者: jarxiv

要約最近の大規模なテキストからイメージまでの拡散モデルは、フォトリアリスティッ … 続きを読む →

カテゴリー: cs.CV, cs.GR, cs.MM | コメントを受け付けていません

RoboFactory: Exploring Embodied Agent Collaboration with Compositional Constraints

投稿日: 2025年3月21日作成者: jarxiv

要約効果的な具体化されたマルチエージェントシステムを設計することは、ドメイン全 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

M3: 3D-Spatial MultiModal Memory

投稿日: 2025年3月21日作成者: jarxiv

要約 3D Spatial Multimodal Memory（M3）は、視覚的 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

DreamTexture: Shape from Virtual Texture with Analysis by Augmentation

投稿日: 2025年3月21日作成者: jarxiv

要約 DreamFusionは、生成モデルの進歩と微分可能なレンダリングを組み合 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

InfiniteYou: Flexible Photo Recrafting While Preserving Your Identity

投稿日: 2025年3月21日作成者: jarxiv

要約特にフラックスのような高度な拡散変圧器（DIT）を使用して、柔軟で忠実なア … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

SynCity: Training-Free Generation of 3D Worlds

投稿日: 2025年3月21日作成者: jarxiv

要約テキストの説明から3Dワールドを生成するという課題に対処します。トレーニ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

MagicMotion: Controllable Video Generation with Dense-to-Sparse Trajectory Guidance

投稿日: 2025年3月21日作成者: jarxiv

要約最近のビデオ生成の進歩により、視覚の質と時間的一貫性の著しい改善がもたらさ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | コメントを受け付けていません

月別アーカイブ: 2025年3月

Scale-wise Distillation of Diffusion Models

SA-Occ: Satellite-Assisted 3D Occupancy Prediction in Real World

Wolf: Dense Video Captioning with a World Summarization Framework

VerbDiff: Text-Only Diffusion Models with Enhanced Interaction Awareness

RoboFactory: Exploring Embodied Agent Collaboration with Compositional Constraints

M3: 3D-Spatial MultiModal Memory

DreamTexture: Shape from Virtual Texture with Analysis by Augmentation

InfiniteYou: Flexible Photo Recrafting While Preserving Your Identity

SynCity: Training-Free Generation of 3D Worlds

MagicMotion: Controllable Video Generation with Dense-to-Sparse Trajectory Guidance

最近の投稿

最近のコメント

アーカイブ

カテゴリー