-
最近の投稿
- Learning to Drive Anywhere with Model-Based Reannotation11
- KineSoft: Learning Proprioceptive Manipulation Policies with Soft Robot Hands
- CityNavAgent: Aerial Vision-and-Language Navigation with Hierarchical Semantic Planning and Global Memory
- Closing the Loop: Motion Prediction Models beyond Open-Loop Benchmarks
- Adaptive Stress Testing Black-Box LLM Planners
-
最近のコメント
表示できるコメントはありません。 cs.AI (37890) cs.CL (28643) cs.CV (43507) cs.HC (2900) cs.LG (42826) cs.RO (22521) cs.SY (3457) eess.IV (5045) eess.SY (3449) stat.ML (5583)
「68T45」カテゴリーアーカイブ
Distilling foundation models for robust and efficient models in digital pathology
要約 近年、デジタル病理のための基礎モデル(FM)の出現は、トレーニング前のデー … 続きを読む
Physics-informed Variational Autoencoders for Improved Robustness to Environmental Factors of Variation
要約 機械学習モデルと物理モデルの組み合わせは、堅牢なデータ表現を学習するための … 続きを読む
Sequence Transferability and Task Order Selection in Continual Learning
要約 継続的な学習では、タスクシーケンスの特性とモデルパフォーマンスとの関係を理 … 続きを読む
GP-GS: Gaussian Processes for Enhanced Gaussian Splatting
要約 3Dガウスのスプラッティングは、効率的なフォトリアリスティックな新規ビュー … 続きを読む
Distilling foundation models for robust and efficient models in digital pathology
要約 近年、デジタル病理のための基礎モデル(FM)の出現は、トレーニング前のデー … 続きを読む
Distilling foundation models for robust and efficient models in digital pathology
要約 近年、デジタル病理のための基礎モデル(FM)の出現は、トレーニング前のデー … 続きを読む
A polynomial formula for the perspective four points problem
要約 n=4 の場合に対する新しいアプローチにより、透視 n 点問題に対する高速 … 続きを読む
Transformer-Based Model for Monocular Visual Odometry: A Video Understanding Approach
要約 単一のカメラからの画像からカメラの姿勢を推定することは、移動ロボットや自律 … 続きを読む
MVTamperBench: Evaluating Robustness of Vision-Language Models
要約 マルチモーダル大規模言語モデル (MLLM) は、ビデオの理解において大き … 続きを読む
A Survey on Dynamic Neural Networks: from Computer Vision to Multi-modal Sensor Fusion
要約 モデル圧縮は、組み込みデバイス上に大規模な Computer Vision … 続きを読む