-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Captured by Captions: On Memorization and its Mitigation in CLIP Models
要約 クリップなどのマルチモーダルモデルは、画像検索やゼロショット分類などのタス … 続きを読む
JetFormer: An Autoregressive Generative Model of Raw Images and Text
要約 モデリングの制約を削除し、ドメイン全体でアーキテクチャを統合することは、大 … 続きを読む
FIOVA: A Multi-Annotator Benchmark for Human-Aligned Video Captioning
要約 大きなビジョン言語モデル(LVLMS)の急速な進歩にもかかわらず、既存のビ … 続きを読む
カテゴリー: cs.CV
FIOVA: A Multi-Annotator Benchmark for Human-Aligned Video Captioning はコメントを受け付けていません
Joint Depth and Reflectivity Estimation using Single-Photon LiDAR
要約 単一光子光の検出と範囲(SPライダーは、長距離、高精度の3D視力タスクの主 … 続きを読む
カテゴリー: cs.CV
Joint Depth and Reflectivity Estimation using Single-Photon LiDAR はコメントを受け付けていません
Anomaly Anything: Promptable Unseen Visual Anomaly Generation
要約 視覚異常検出(AD)は、異常なデータサンプルの希少性のために重要な課題を提 … 続きを読む
カテゴリー: cs.CV
Anomaly Anything: Promptable Unseen Visual Anomaly Generation はコメントを受け付けていません
Unlocking the Potential of Difficulty Prior in RL-based Multimodal Reasoning
要約 この作業では、問題の困難の事前情報を明示的にモデル化することで、マルチモー … 続きを読む
カテゴリー: cs.CV
Unlocking the Potential of Difficulty Prior in RL-based Multimodal Reasoning はコメントを受け付けていません
DB3D-L: Depth-aware BEV Feature Transformation for Accurate 3D Lane Detection
要約 3Dレーン検出は、自律運転において重要な役割を果たします。 最近の進歩は、 … 続きを読む
カテゴリー: cs.CV
DB3D-L: Depth-aware BEV Feature Transformation for Accurate 3D Lane Detection はコメントを受け付けていません
Quantifying Context Bias in Domain Adaptation for Object Detection
要約 オブジェクト検出のためのドメイン適応(DAOD)は、訓練されたモデルをソー … 続きを読む
Event-Driven Dynamic Scene Depth Completion
要約 ダイナミックシーンの深さの完了は、RGB画像やLIDAR測定などの入力モダ … 続きを読む
カテゴリー: cs.CV
Event-Driven Dynamic Scene Depth Completion はコメントを受け付けていません
Computer Vision Models Show Human-Like Sensitivity to Geometric and Topological Concepts
要約 機械学習(ML)モデルの急速な改善により、認知科学者は人間の考え方との整合 … 続きを読む
カテゴリー: cs.CV
Computer Vision Models Show Human-Like Sensitivity to Geometric and Topological Concepts はコメントを受け付けていません