-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Real-Time Anomaly Detection in Video Streams
要約 この論文は、Othello 社と LIASD 研究室との間の CIFRE … 続きを読む
CLIPArTT: Adaptation of CLIP to New Domains at Test Time
要約 CLIP に代表される、事前トレーニング済みのビジョン言語モデル (VLM … 続きを読む
A Multi-Loss Strategy for Vehicle Trajectory Prediction: Combining Off-Road, Diversity, and Directional Consistency Losses
要約 軌道予測は、自動運転車の計画の安全性と効率性にとって不可欠です。 しかし、 … 続きを読む
A Comprehensive Content Verification System for ensuring Digital Integrity in the Age of Deep Fakes
要約 デジタル コンテンツが広範に共有される時代において、堅牢なコンテンツの完全 … 続きを読む
Domain-Adaptive Pre-training of Self-Supervised Foundation Models for Medical Image Classification in Gastrointestinal Endoscopy
要約 ビデオ カプセル内視鏡は、消化管の詳細な画像を取得する非侵襲的な方法を提供 … 続きを読む
DeSplat: Decomposed Gaussian Splatting for Distractor-Free Rendering
要約 ガウス スプラッティングにより、静的な 3D 環境での新しいビューの高速合 … 続きを読む
Dual Risk Minimization: Towards Next-Level Robustness in Fine-tuning Zero-Shot Models
要約 基礎モデルを微調整すると、分布の変化に対する堅牢性が損なわれることがよくあ … 続きを読む
LaVIDE: A Language-Vision Discriminator for Detecting Changes in Satellite Image with Map References
要約 通常、二時点画像の比較に依存する変更検出は、単一の画像しか利用できない場合 … 続きを読む
LongVALE: Vision-Audio-Language-Event Benchmark Towards Time-Aware Omni-Modal Perception of Long Videos
要約 ビデオの理解は目覚ましい進歩を遂げているにもかかわらず、ほとんどの取り組み … 続きを読む
PerLA: Perceptive 3D Language Assistant
要約 大規模言語モデル (LLM) で 3D 物理世界を理解できるようにすること … 続きを読む