-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.LG」カテゴリーアーカイブ
Hierarchical Object-Oriented POMDP Planning for Object Rearrangement
要約 部分的に観測可能な複数の部屋の環境における複数オブジェクトの再配置問題を解 … 続きを読む
URSA: Understanding and Verifying Chain-of-thought Reasoning in Multimodal Mathematics
要約 思考連鎖 (CoT) 推論は、大規模言語モデル (LLM) の数学的推論に … 続きを読む
Efficient Video-Based ALPR System Using YOLO and Visual Rhythm
要約 自動ナンバー プレート認識 (ALPR) には、画像またはビデオ キャプチ … 続きを読む
Energy-based Hopfield Boosting for Out-of-Distribution Detection
要約 機械学習モデルを現実世界に展開する場合、配布外 (OOD) の検出が重要で … 続きを読む
Tutorial on Diffusion Models for Imaging and Vision
要約 近年の生成ツールの驚くべき成長により、テキストから画像の生成やテキストから … 続きを読む
Towards Fair Class-wise Robustness: Class Optimal Distribution Adversarial Training
要約 敵対的トレーニングは、敵対的攻撃に対するディープ ニューラル ネットワーク … 続きを読む
Combining YOLO and Visual Rhythm for Vehicle Counting
要約 ビデオベースの車両検出と計数は、交通インフラの管理において重要な役割を果た … 続きを読む
VideoRefer Suite: Advancing Spatial-Temporal Object Understanding with Video LLM
要約 ビデオ大規模言語モデル (ビデオ LLM) は、最近、一般的なビデオの理解 … 続きを読む
Rad4XCNN: a new agnostic method for post-hoc global explanation of CNN-derived features by means of radiomics
要約 近年、機械学習ベースの臨床意思決定支援システム (CDSS) が、いくつか … 続きを読む