-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年3月
Vision as LoRA
要約 LLMをMLLMに変換するための新しいパラダイムであるLora(Vora) … 続きを読む
Towards Scalable Foundation Model for Multi-modal and Hyperspectral Geospatial Data
要約 さまざまな時期やスペクトルバンドで衛星ベースのイメージングシステムによって … 続きを読む
Benchmarking Machine Learning Methods for Distributed Acoustic Sensing
要約 分散音響センシング(DAS)テクノロジーは、光ファイバーに沿った微小摂動の … 続きを読む
GLRD: Global-Local Collaborative Reason and Debate with PSL for 3D Open-Vocabulary Detection
要約 LIDARベースの3Dオープンボキャブラリー検出(3D OVD)のタスクで … 続きを読む
カテゴリー: cs.CV
GLRD: Global-Local Collaborative Reason and Debate with PSL for 3D Open-Vocabulary Detection はコメントを受け付けていません
Flip Learning: Weakly Supervised Erase to Segment Nodules in Breast Ultrasound
要約 2D乳房超音波(BUS)と3D自動乳房超音波(ABUS)の両方における結節 … 続きを読む
Harmony: A Joint Self-Supervised and Weakly-Supervised Framework for Learning General Purpose Visual Representations
要約 クリップなどのビジョン言語対照学習フレームワークは、自然言語の監督から学習 … 続きを読む
Data Augmentation in Earth Observation: A Diffusion Model Approach
要約 高品質の地球観測(EO)画像は、正確な分析とセクター全体で情報に基づいた意 … 続きを読む
MMMORRF: Multimodal Multilingual Modularized Reciprocal Rank Fusion
要約 ビデオには、視覚イベント、テキストオーバーレイ、サウンド、音声など、複数の … 続きを読む
Networking Systems for Video Anomaly Detection: A Tutorial and Survey
要約 オンラインビデオアプリケーションの急増と相まって、スマートシティでの監視カ … 続きを読む