cs.AI」カテゴリーアーカイブ

RADIO Amplified: Improved Baselines for Agglomerative Vision Foundation Models

要約 集約モデルは、CLIP、DINO、SAM などの既存のモデルから複数の教師 … 続きを読む

カテゴリー: cs.AI, cs.CV | RADIO Amplified: Improved Baselines for Agglomerative Vision Foundation Models はコメントを受け付けていません

SimVS: Simulating World Inconsistencies for Robust View Synthesis

要約 ノベルビュー合成技術は、静的シーンでは印象的な結果を達成しますが、照明の変 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG | SimVS: Simulating World Inconsistencies for Robust View Synthesis はコメントを受け付けていません

STIV: Scalable Text and Image Conditioned Video Generation

要約 ビデオ生成の分野は目覚ましい進歩を遂げていますが、堅牢でスケーラブルなモデ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | STIV: Scalable Text and Image Conditioned Video Generation はコメントを受け付けていません

GASP: Gaussian Avatars with Synthetic Priors

要約 ガウス スプラッティングは、リアルタイムの写真のようにリアルなレンダリング … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR | GASP: Gaussian Avatars with Synthetic Priors はコメントを受け付けていません

PortraitTalk: Towards Customizable One-Shot Audio-to-Talking Face Generation

要約 オーディオ主導の話し顔の生成は、デジタル コミュニケーションにおける困難な … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | PortraitTalk: Towards Customizable One-Shot Audio-to-Talking Face Generation はコメントを受け付けていません

SAT: Spatial Aptitude Training for Multimodal Language Models

要約 空間認識は知能の基本的な要素です。 多くの研究は、大規模なマルチモーダル言 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.RO | SAT: Spatial Aptitude Training for Multimodal Language Models はコメントを受け付けていません

Video Motion Transfer with Diffusion Transformers

要約 私たちは、参照ビデオのモーションを新しく合成されたビデオに転送する方法であ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Video Motion Transfer with Diffusion Transformers はコメントを受け付けていません

XRZoo: A Large-Scale and Versatile Dataset of Extended Reality (XR) Applications

要約 拡張現実 (XR、AR、MR、VR を含む) と空間コンピューティング テ … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.HC, cs.SE | XRZoo: A Large-Scale and Versatile Dataset of Extended Reality (XR) Applications はコメントを受け付けていません

ContRail: A Framework for Realistic Railway Image Synthesis using ControlNet

要約 ディープラーニングは、その並外れた有効性と多くの分野への適用性により、広く … 続きを読む

カテゴリー: cs.AI, cs.CV | ContRail: A Framework for Realistic Railway Image Synthesis using ControlNet はコメントを受け付けていません

[MASK] is All You Need

要約 生成モデルでは、次のセット予測ベースのマスク生成モデルと次のノイズ予測ベー … 続きを読む

カテゴリー: cs.AI, cs.CV | [MASK] is All You Need はコメントを受け付けていません