-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Leveraging Color Channel Independence for Improved Unsupervised Object Detection
要約 オブジェクト中心のアーキテクチャは、ビジュアル シーンから個別のオブジェク … 続きを読む
LlamaFusion: Adapting Pretrained Language Models for Multimodal Generation
要約 私たちは、マルチモーダル生成機能を備えた事前トレーニング済みのテキスト専用 … 続きを読む
DI-PCG: Diffusion-based Efficient Inverse Procedural Content Generation for High-quality 3D Asset Creation
要約 プロシージャル コンテンツ生成 (PCG) は、高品質の 3D コンテンツ … 続きを読む
PRIMA: Multi-Image Vision-Language Models for Reasoning Segmentation
要約 Large Vision-Language Model (LVLM) の大 … 続きを読む
Scaling 4D Representations
要約 ビデオからの純粋な自己教師あり学習については、スケーリングが説得力を持って … 続きを読む
Gauss-Newton Dynamics for Neural Networks: A Riemannian Optimization Perspective
要約 滑らかな活性化関数を使用してニューラル ネットワークをトレーニングするため … 続きを読む
E-CAR: Efficient Continuous Autoregressive Image Generation via Multistage Modeling
要約 画像生成用の連続トークンを使用した自己回帰 (AR) モデルの最近の進歩に … 続きを読む
Enhancing Vision-Language Models with Scene Graphs for Traffic Accident Understanding
要約 交通事故の認識は、自動運転システムや道路監視システムにとって不可欠な部分で … 続きを読む
Multi-Agent Motion Planning For Differential Drive Robots Through Stationary State Search
要約 Multi-Agent Motion Planning (MAMP) は、 … 続きを読む
MarineFormer: A Spatio-Temporal Attention Model for USV Navigation in Dynamic Marine Environments
要約 動的な障害物と静的な障害物、および高流量の河川などの強い流れの乱れを含む海 … 続きを読む