月別アーカイブ: 2025年3月

Scale-wise Distillation of Diffusion Models

要約 SWDは、拡散ベースの少ないステップジェネレーターの次のスケール予測アイデ … 続きを読む

カテゴリー: cs.CV | Scale-wise Distillation of Diffusion Models はコメントを受け付けていません

SA-Occ: Satellite-Assisted 3D Occupancy Prediction in Real World

要約 既存のビジョンベースの3D占有予測法は、衛星ビューを組み込むことの潜在的な … 続きを読む

カテゴリー: cs.AI, cs.CV | SA-Occ: Satellite-Assisted 3D Occupancy Prediction in Real World はコメントを受け付けていません

Wolf: Dense Video Captioning with a World Summarization Framework

要約 正確なビデオキャプションのための世界要約フレームワークであるWolfを提案 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | Wolf: Dense Video Captioning with a World Summarization Framework はコメントを受け付けていません

VerbDiff: Text-Only Diffusion Models with Enhanced Interaction Awareness

要約 最近の大規模なテキストからイメージまでの拡散モデルは、フォトリアリスティッ … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.MM | VerbDiff: Text-Only Diffusion Models with Enhanced Interaction Awareness はコメントを受け付けていません

RoboFactory: Exploring Embodied Agent Collaboration with Compositional Constraints

要約 効果的な具体化されたマルチエージェントシステムを設計することは、ドメイン全 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | RoboFactory: Exploring Embodied Agent Collaboration with Compositional Constraints はコメントを受け付けていません

M3: 3D-Spatial MultiModal Memory

要約 3D Spatial Multimodal Memory(M3)は、視覚的 … 続きを読む

カテゴリー: cs.CV, cs.RO | M3: 3D-Spatial MultiModal Memory はコメントを受け付けていません

DreamTexture: Shape from Virtual Texture with Analysis by Augmentation

要約 DreamFusionは、生成モデルの進歩と微分可能なレンダリングを組み合 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | DreamTexture: Shape from Virtual Texture with Analysis by Augmentation はコメントを受け付けていません

InfiniteYou: Flexible Photo Recrafting While Preserving Your Identity

要約 特にフラックスのような高度な拡散変圧器(DIT)を使用して、柔軟で忠実なア … 続きを読む

カテゴリー: cs.CV, cs.LG | InfiniteYou: Flexible Photo Recrafting While Preserving Your Identity はコメントを受け付けていません

SynCity: Training-Free Generation of 3D Worlds

要約 テキストの説明から3Dワールドを生成するという課題に対処します。 トレーニ … 続きを読む

カテゴリー: cs.CV | SynCity: Training-Free Generation of 3D Worlds はコメントを受け付けていません

MagicMotion: Controllable Video Generation with Dense-to-Sparse Trajectory Guidance

要約 最近のビデオ生成の進歩により、視覚の質と時間的一貫性の著しい改善がもたらさ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | MagicMotion: Controllable Video Generation with Dense-to-Sparse Trajectory Guidance はコメントを受け付けていません