-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年5月
MINERVA: Evaluating Complex Video Reasoning
要約 マルチモーダルLLMSはビデオベンチマークに焦点を合わせていますが、ほとん … 続きを読む
Visual Test-time Scaling for GUI Agent Grounding
要約 Vision言語モデルエージェントの視覚的なテスト時間スケーリングアプロー … 続きを読む
GuideSR: Rethinking Guidance for One-Step High-Fidelity Diffusion-Based Super-Resolution
要約 この論文では、画像の忠実度を高めるために特別に設計された新しいシングルステ … 続きを読む
Towards Autonomous Micromobility through Scalable Urban Simulation
要約 配送ロボットやモビリティスクーターなどの都市の公共スペースに移動する軽量の … 続きを読む
Robotic Visual Instruction
要約 最近、自然言語は、人間とロボットの相互作用の主要な媒体でした。 ただし、ロ … 続きを読む
RayZer: A Self-supervised Large View Synthesis Model
要約 3Dの監督なしで訓練された自己監視マルチビュー3Dビジョンモデル、つまりカ … 続きを読む
カテゴリー: cs.CV
RayZer: A Self-supervised Large View Synthesis Model はコメントを受け付けていません
T2I-R1: Reinforcing Image Generation with Collaborative Semantic-level and Token-level CoT
要約 大規模な言語モデルの最近の進歩により、チェーンオブシュー(COT)と補強学 … 続きを読む
Controllable Weather Synthesis and Removal with Video Diffusion Models
要約 ビデオで現実的で制御可能な気象効果を生成することは、多くのアプリケーション … 続きを読む
How Real Are Synthetic Therapy Conversations? Evaluating Fidelity in Prolonged Exposure Dialogues
要約 ヘルスケアにおける合成データの採用の増大は、プライバシーの懸念、現実世界の … 続きを読む
VecFontSDF: Learning to Reconstruct and Synthesize High-quality Vector Fonts via Signed Distance Functions
要約 フォント設計は、デジタルコンテンツデザインと最新の印刷業界で非常に重要です … 続きを読む
カテゴリー: cs.CV
VecFontSDF: Learning to Reconstruct and Synthesize High-quality Vector Fonts via Signed Distance Functions はコメントを受け付けていません