-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2022年9月
Test-Time Prompt Tuning for Zero-Shot Generalization in Vision-Language Models
要約 事前にトレーニングされたビジョン言語モデル (CLIP など) は、適切に … 続きを読む
カテゴリー: cs.CV
Test-Time Prompt Tuning for Zero-Shot Generalization in Vision-Language Models はコメントを受け付けていません
Distribution Aware Metrics for Conditional Natural Language Generation
要約 条件付き自然言語生成を評価するための従来の自動化されたメトリクスは、単一の … 続きを読む
On-Device Domain Generalization
要約 小さなニューラル ネットワークのドメイン一般化 (DG) の体系的な研究を … 続きを読む
Test-Time Training with Masked Autoencoders
要約 テスト時間トレーニングは、自己監視を使用して各テスト入力のモデルを最適化す … 続きを読む
DoodleFormer: Creative Sketch Drawing with Transformers
要約 創造的なスケッチや落書きは表現活動であり、日常の視覚的オブジェクトの想像力 … 続きを読む
OmniVL:One Foundation Model for Image-Language and Video-Language Tasks
要約 このホワイト ペーパーでは、1 つのユニバーサル アーキテクチャを使用して … 続きを読む
カテゴリー: cs.CV
OmniVL:One Foundation Model for Image-Language and Video-Language Tasks はコメントを受け付けていません
NAAP-440 Dataset and Baseline for Neural Architecture Accuracy Prediction
要約 ニューラル アーキテクチャ検索 (NAS) は、さまざまなターゲット プラ … 続きを読む
Learning to Evaluate Performance of Multi-modal Semantic Localization
要約 セマンティック ローカリゼーション (SeLo) は、テキストなどのセマン … 続きを読む
Private Eye: On the Limits of Textual Screen Peeking via Eyeglass Reflections in Video Conferencing
要約 この研究では、数学的モデリングと人間を対象とした実験を使用して、新しいウェ … 続きを読む
Point Cloud Registration-Driven Robust Feature Matching for 3D Siamese Object Tracking
要約 テンプレートと検索領域の間の堅牢な特徴の一致を学習することは、3D シャム … 続きを読む