-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Robust Change Captioning in Remote Sensing: SECOND-CC Dataset and MModalCC Framework
要約 リモート センシング変化キャプション (RSICC) は、両時間画像間の変 … 続きを読む
VLSBench: Unveiling Visual Leakage in Multimodal Safety
要約 マルチモーダル大規模言語モデル (MLLM) の安全性に関する懸念は、さま … 続きを読む
landmarker: a Toolkit for Anatomical Landmark Localization in 2D/3D Images
要約 2D/3D 画像における解剖学的ランドマークの位置特定は、医療画像処理にお … 続きを読む
Universal Actions for Enhanced Embodied Foundation Models
要約 多様なインターネット規模のデータでのトレーニングは、最近の大規模な基盤モデ … 続きを読む
Tarsier2: Advancing Large Vision-Language Models from Detailed Video Description to Comprehensive Video Understanding
要約 Tarsier2 は、詳細かつ正確なビデオ説明を生成するために設計された最 … 続きを読む
Spatio-temporal Graph Learning on Adaptive Mined Key Frames for High-performance Multi-Object Tracking
要約 マルチオブジェクト追跡の領域では、ビデオ シーケンス内のオブジェクト間の空 … 続きを読む
Generate E-commerce Product Background by Integrating Category Commonality and Personalized Style
要約 電子商取引の製品背景を生成する最先端の方法は、制作をスケールアップする際に … 続きを読む
Deep Compression Autoencoder for Efficient High-Resolution Diffusion Models
要約 高解像度拡散モデルを加速するための新しいオートエンコーダー モデル ファミ … 続きを読む
Bridging Diversity and Uncertainty in Active learning with Self-Supervised Pre-Training
要約 この研究は、特に自己教師付き事前トレーニング済みモデルのコンテキスト内での … 続きを読む
3rd Workshop on Maritime Computer Vision (MaCVi) 2025: Challenge Results
要約 2025 年海洋コンピュータ ビジョン (MaCVi) に関する第 3 回 … 続きを読む