-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.LG」カテゴリーアーカイブ
Do generative video models understand physical principles?
要約 AIビデオ生成は革命を起こしており、品質とリアリズムが急速に進歩しています … 続きを読む
ThermoHands: A Benchmark for 3D Hand Pose Estimation from Egocentric Thermal Images
要約 複雑で実世界のシナリオで確実に実行できるエゴセントリック3Dハンドポーズ推 … 続きを読む
Deep Convolutional Neural Networks for Palm Fruit Maturity Classification
要約 パーム油の収量と品質を最大化するには、最適な成熟段階でヤシの果物を収穫する … 続きを読む
Dreamweaver: Learning Compositional World Models from Pixels
要約 人間は、世界の認識をオブジェクトと、色、形状、運動パターンなどの属性に分解 … 続きを読む
Exploring QUIC Dynamics: A Large-Scale Dataset for Encrypted Traffic Analysis
要約 QUIC Transport Protocolの採用の増加により、暗号化さ … 続きを読む
Deep Modeling of Non-Gaussian Aleatoric Uncertainty
要約 ディープラーニングは、特に不確実性分布が固定およびガウスの伝統的な仮定に適 … 続きを読む
HVI: A New color space for Low-light Image Enhancement
要約 Low-light Image Enhancement(LLIE)は、破損 … 続きを読む
Visual Adaptive Prompting for Compositional Zero-Shot Learning
要約 Vision-Language Models(VLMS)は、視覚データとテ … 続きを読む
Judge a Book by its Cover: Investigating Multi-Modal LLMs for Multi-Page Handwritten Document Transcription
要約 手書きのテキスト認識(HTR)は、特にページが共通のフォーマットとコンテキ … 続きを読む
A Dataset and Framework for Learning State-invariant Object Representations
要約 認識と検索のためにオブジェクト表現を学習するために、より一般的に使用される … 続きを読む