-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年3月
Kolmogorov-Arnold Attention: Is Learnable Attention Better For Vision Transformers?
要約 Kolmogorov-Arnold Networks(KANS)は、データ … 続きを読む
HybridVLA: Collaborative Diffusion and Autoregression in a Unified Vision-Language-Action Model
要約 一般的な推論のための視覚言語モデル(VLM)の最近の進歩により、視覚言語ア … 続きを読む
Charting and Navigating Hugging Face’s Model Atlas
要約 現在、何百万もの公開されているニューラルネットワークがあるため、大規模なモ … 続きを読む
A Frustratingly Simple Yet Highly Effective Attack Baseline: Over 90% Success Rate Against the Strong Black-box Models of GPT-4.5/4o/o1
要約 オープンソースの大型ビジョン言語モデル(LVLMS)での有望なパフォーマン … 続きを読む
V2Edit: Versatile Video Diffusion Editor for Videos and 3D Scenes
要約 このペーパーでは、v $^2 $ editを紹介します。これは、指導ガイド … 続きを読む
カテゴリー: cs.CV
V2Edit: Versatile Video Diffusion Editor for Videos and 3D Scenes はコメントを受け付けていません
Distilling Diversity and Control in Diffusion Models
要約 蒸留拡散モデルは、重大な制限に悩まされています。サンプルの多様性の低下と比 … 続きを読む
The Curse of Conditions: Analyzing and Improving Optimal Transport for Conditional Flow-Based Generation
要約 ミニバッチ最適な輸送カップリングは、無条件のフローマッチングでパスをまっす … 続きを読む
GoT: Unleashing Reasoning Capability of Multimodal Large Language Model for Visual Generation and Editing
要約 現在の画像生成と編集方法は、主に視覚構成や明示的な操作について推論すること … 続きを読む
カテゴリー: cs.CV
GoT: Unleashing Reasoning Capability of Multimodal Large Language Model for Visual Generation and Editing はコメントを受け付けていません
Studying Classifier(-Free) Guidance From a Classifier-Centric Perspective
要約 分類器のないガイダンスは、拡散モデルを除去する条件付き発電の定番となってい … 続きを読む
Representation Retrieval Learning for Heterogeneous Data Integration
要約 ビッグデータの時代では、大規模でマルチモーダルデータセットがますます遍在し … 続きを読む