-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Detect an Object At Once without Fine-tuning
要約 これまで見たことのないオブジェクトの 1 枚または数枚の写真が提示されると … 続きを読む
Double Descent Meets Out-of-Distribution Detection: Theoretical Insights and Empirical Analysis on the role of model complexity
要約 過剰パラメータ化は一般化に利益をもたらすことが知られていますが、配信外 ( … 続きを読む
Fast yet Safe: Early-Exiting with Risk Control
要約 機械学習モデルのスケーリングは、その性能を大幅に向上させる。しかし、このよ … 続きを読む
Hunyuan3D-1.0: A Unified Framework for Text-to-3D and Image-to-3D Generation
要約 3D生成モデルはアーティストのワークフローを大きく改善したが、3D生成のた … 続きを読む
Taxonomy-Aware Continual Semantic Segmentation in Hyperbolic Spaces for Open-World Perception
要約 意味セグメンテーションモデルは通常、固定されたクラスセットで学習されるため … 続きを読む
GenXD: Generating Any 3D and 4D Scenes
要約 近年の2D映像生成の発展は目覚ましい。しかし、3Dや4Dの生成は、大規模な … 続きを読む
EMMA: End-to-End Multimodal Model for Autonomous Driving
要約 自律走行のためのエンドツーエンドのマルチモーダルモデルであるEMMAを紹介 … 続きを読む
How Far is Video Generation from World Model: A Physical Law Perspective
要約 OpenAIのSoraは、基本的な物理法則に準拠した世界モデルを開発するた … 続きを読む
Adaptive Length Image Tokenization via Recurrent Allocation
要約 現在の視覚システムは通常、情報量に関係なく、画像に固定長の表現を割り当てて … 続きを読む