-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Unraveling Cross-Modality Knowledge Conflicts in Large Vision-Language Models
要約 Large Vision-Language Model (LVLM) は、 … 続きを読む
Bridge the Points: Graph-based Few-shot Segment Anything Semantically
要約 大規模な事前トレーニング技術の最近の進歩により、ビジョン基盤モデル、特にポ … 続きを読む
カテゴリー: cs.CV
Bridge the Points: Graph-based Few-shot Segment Anything Semantically はコメントを受け付けていません
Calibrated Cache Model for Few-Shot Vision-Language Model Adaptation
要約 キャッシュベースのアプローチは、ビジョン言語モデル (VLM) を適応させ … 続きを読む
カテゴリー: cs.CV
Calibrated Cache Model for Few-Shot Vision-Language Model Adaptation はコメントを受け付けていません
LoTLIP: Improving Language-Image Pre-training for Long Text Understanding
要約 長いテキストを理解することは実際には大きな要求ですが、ほとんどの言語画像事 … 続きを読む
カテゴリー: cs.CV
LoTLIP: Improving Language-Image Pre-training for Long Text Understanding はコメントを受け付けていません
Efficient Hyperparameter Importance Assessment for CNNs
要約 ハイパーパラメータの選択は機械学習パイプラインの重要な側面であり、モデルの … 続きを読む
Accurately Classifying Out-Of-Distribution Data in Facial Recognition
要約 標準的な分類理論では、テスト セットとトレーニング セット内の画像の分布が … 続きを読む
HyperPg — Prototypical Gaussians on the Hypersphere for Interpretable Deep Learning
要約 プロトタイプ学習手法は、ブラックボックスの深層学習モデルに代わる解釈可能な … 続きを読む
Zero-Shot Pupil Segmentation with SAM 2: A Case Study of Over 14 Million Images
要約 私たちは、視線推定および視線追跡技術の進歩における、視覚基盤モデルである … 続きを読む
For a semiotic AI: Bridging computer vision and visual semiotics for computational observation of large scale facial image archives
要約 ソーシャル ネットワークは、人間の顔や体の画像の認知的、感情的、実用的な価 … 続きを読む
カテゴリー: cs.CV
For a semiotic AI: Bridging computer vision and visual semiotics for computational observation of large scale facial image archives はコメントを受け付けていません
Match me if you can: Semi-Supervised Semantic Correspondence Learning with Unpaired Images
要約 セマンティック対応方法は、モデルの能力を最大化することを目的として、複雑な … 続きを読む