-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
RADIO Amplified: Improved Baselines for Agglomerative Vision Foundation Models
要約 集約モデルは、CLIP、DINO、SAM などの既存のモデルから複数の教師 … 続きを読む
SimVS: Simulating World Inconsistencies for Robust View Synthesis
要約 ノベルビュー合成技術は、静的シーンでは印象的な結果を達成しますが、照明の変 … 続きを読む
STIV: Scalable Text and Image Conditioned Video Generation
要約 ビデオ生成の分野は目覚ましい進歩を遂げていますが、堅牢でスケーラブルなモデ … 続きを読む
GASP: Gaussian Avatars with Synthetic Priors
要約 ガウス スプラッティングは、リアルタイムの写真のようにリアルなレンダリング … 続きを読む
PortraitTalk: Towards Customizable One-Shot Audio-to-Talking Face Generation
要約 オーディオ主導の話し顔の生成は、デジタル コミュニケーションにおける困難な … 続きを読む
SAT: Spatial Aptitude Training for Multimodal Language Models
要約 空間認識は知能の基本的な要素です。 多くの研究は、大規模なマルチモーダル言 … 続きを読む
Video Motion Transfer with Diffusion Transformers
要約 私たちは、参照ビデオのモーションを新しく合成されたビデオに転送する方法であ … 続きを読む
XRZoo: A Large-Scale and Versatile Dataset of Extended Reality (XR) Applications
要約 拡張現実 (XR、AR、MR、VR を含む) と空間コンピューティング テ … 続きを読む
ContRail: A Framework for Realistic Railway Image Synthesis using ControlNet
要約 ディープラーニングは、その並外れた有効性と多くの分野への適用性により、広く … 続きを読む
[MASK] is All You Need
要約 生成モデルでは、次のセット予測ベースのマスク生成モデルと次のノイズ予測ベー … 続きを読む