-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年1月
Deep Compression Autoencoder for Efficient High-Resolution Diffusion Models
要約 高解像度拡散モデルを加速するための新しいオートエンコーダー モデル ファミ … 続きを読む
Towards an End-to-End (E2E) Adversarial Learning and Application in the Physical World
要約 パッチベースの敵対的攻撃の従来の学習プロセスは、デジタル ドメインで実行さ … 続きを読む
AI Driven Water Segmentation with deep learning models for Enhanced Flood Monitoring
要約 洪水は毎年重大な死者と経済的損失を引き起こす主要な自然災害であり、気候変動 … 続きを読む
FaVoR: Features via Voxel Rendering for Camera Relocalization
要約 カメラの再位置推定方法は、密な画像の位置合わせからクエリ画像からの直接的な … 続きを読む
RMem: Restricted Memory Banks Improve Video Object Segmentation
要約 最近のビデオ オブジェクト セグメンテーション (VOS) ベンチマークが … 続きを読む
SmartEraser: Remove Anything from Images using Masked-Region Guidance
要約 これまで、オブジェクトの削除はマスクと修復のパラダイムが主流でした。このパ … 続きを読む
カテゴリー: cs.CV
SmartEraser: Remove Anything from Images using Masked-Region Guidance はコメントを受け付けていません
LLaVA-ST: A Multimodal Large Language Model for Fine-Grained Spatial-Temporal Understanding
要約 マルチモーダル大規模言語モデル (MLLM) の最近の進歩により、有望な結 … 続きを読む
カテゴリー: cs.CV
LLaVA-ST: A Multimodal Large Language Model for Fine-Grained Spatial-Temporal Understanding はコメントを受け付けていません
Can Bayesian Neural Networks Explicitly Model Input Uncertainty?
要約 機械学習モデルへの入力には、関連するノイズや不確実性が含まれる場合がありま … 続きを読む
VINGS-Mono: Visual-Inertial Gaussian Splatting Monocular SLAM in Large Scenes
要約 VINGS-Mono は、大規模なシーン向けに設計された単眼 (慣性) ガ … 続きを読む
A Multi-Modal Approach for Face Anti-Spoofing in Non-Calibrated Systems using Disparity Maps
要約 顔認識技術はさまざまなアプリケーションでますます使用されていますが、顔のな … 続きを読む