-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.LG」カテゴリーアーカイブ
Accurate AI-Driven Emergency Vehicle Location Tracking in Healthcare ITS Digital Twin
要約 ヘルスケア用のデジタルツイン(DT)の作成インテリジェント輸送システム(H … 続きを読む
A Schema-Guided Reason-while-Retrieve framework for Reasoning on Scene Graphs with Large-Language-Models (LLMs)
要約 シーングラフは、大きな言語モデル(LLM)を使用した接地された空間推論のた … 続きを読む
Adapt-Pruner: Adaptive Structural Pruning for Efficient Small Language Model Training
要約 小言語モデル(SLM)は、エッジデバイスでの幅広いアプリケーションのため、 … 続きを読む
Edge Attention Module for Object Classification
要約 この研究では、オブジェクト分類タスクに関する新しい「エッジ注意ベースの畳み … 続きを読む
3D Face Reconstruction From Radar Images
要約 顔の3D再構成は、コンピュータービジョンで広く注目され、たとえばアニメーシ … 続きを読む
Assessing Open-world Forgetting in Generative Image Model Customization
要約 拡散モデルの最近の進歩により、画像生成機能が大幅に向上しています。 ただし … 続きを読む
MaxInfo: A Training-Free Key-Frame Selection Method Using Maximum Volume for Enhanced Video Understanding
要約 最新のビデオ大規模な言語モデル(VLLM)は、ビデオ理解のために均一なフレ … 続きを読む
Learnable Expansion of Graph Operators for Multi-Modal Feature Fusion
要約 コンピュータービジョンのタスクでは、機能は多様な表現、ドメイン(屋内や屋外 … 続きを読む
A Kolmogorov metric embedding for live cell microscopy signaling patterns
要約 5-d $(x、y、z、チャネル、時間)$ライブセル顕微鏡映画で、細胞シグ … 続きを読む
Long-tailed Medical Diagnosis with Relation-aware Representation Learning and Iterative Classifier Calibration
要約 最近、コンピューター支援診断により、有望なパフォーマンスが実証されており、 … 続きを読む