-
最近の投稿
- Automated Capability Discovery via Model Self-Exploration
- SoK: A Classification for AI-driven Personalized Privacy Assistants
- Next Block Prediction: Video Generation via Semi-Autoregressive Modeling
- Geometry-aware RL for Manipulation of Varying Shapes and Deformable Objects
- Space-Aware Instruction Tuning: Dataset and Benchmark for Guide Dog Robots Assisting the Visually Impaired
-
最近のコメント
表示できるコメントはありません。 cs.AI (33559) cs.CL (25358) cs.CR (2592) cs.CV (39576) cs.LG (38529) cs.RO (19544) cs.SY (2986) eess.IV (4736) eess.SY (2980) stat.ML (5081)
月別アーカイブ: 2025年1月
Adaptive Object Detection for Indoor Navigation Assistance: A Performance Evaluation of Real-Time Algorithms
要約 この研究では、視覚障害のある個人の支援技術における正確で効率的なオブジェク … 続きを読む
Quantifying uncertainty in lung cancer segmentation with foundation models applied to mixed-domain datasets
要約 Medical Image Foundationモデルは、微調整を最小限に … 続きを読む
Swin transformers are robust to distribution and concept drift in endoscopy-based longitudinal rectal cancer assessment
要約 内視鏡画像は、がんのスクリーニング、診断、大腸炎などの治療からの反応と毒性 … 続きを読む
Transfer Learning for Keypoint Detection in Low-Resolution Thermal TUG Test Images
要約 この研究は、転送学習技術を使用した低解像度の熱画像におけるヒトキーポイント … 続きを読む
A Benchmark and Evaluation for Real-World Out-of-Distribution Detection Using Vision-Language Models
要約 分散除外(OOD)検出は、展開されたモデルの安全性を確保するために、推論中 … 続きを読む
Return of the Encoder: Maximizing Parameter Efficiency for SLMs
要約 大規模なデコーダーのみの言語モデルの優位性は、シーケンス処理における基本的 … 続きを読む
Tuning Vision Foundation Model via Test-Time Prompt-Guided Training for VFSS Segmentations
要約 Vision Foundationモデルは、ジェネリック画像と特殊な画像の … 続きを読む
SimpleDepthPose: Fast and Reliable Human Pose Estimation with RGBD-Images
要約 急速に進むコンピュータービジョンのドメインでは、特に信頼性が重要な要件であ … 続きを読む
Track-On: Transformer-based Online Point Tracking with Memory
要約 この論文では、外観、照明、視点、および閉塞の変化にもかかわらず、ビデオ内の … 続きを読む
Runway vs. Taxiway: Challenges in Automated Line Identification and Notation Approaches
要約 自律システムの複雑さの増加により、運用上の安全性を確保するために、滑走路と … 続きを読む