-
最近の投稿
- An Imitative Reinforcement Learning Framework for Autonomous Dogfight
- Blind-Wayfarer: A Minimalist, Probing-Driven Framework for Resilient Navigation in Perception-Degraded Environments
- Force Aware Branch Manipulation To Assist Agricultural Tasks
- PIPE Planner: Pathwise Information Gain with Map Predictions for Indoor Robot Exploration
- Maintaining Plasticity in Reinforcement Learning: A Cost-Aware Framework for Aerial Robot Control in Non-stationary Environments
-
最近のコメント
表示できるコメントはありません。 cs.AI (34893) cs.CL (26381) cs.CR (2680) cs.CV (40725) cs.LG (39905) cs.RO (20465) cs.SY (3102) eess.IV (4829) eess.SY (3096) stat.ML (5246)
月別アーカイブ: 2022年8月
Retrieval-Augmented Transformer for Image Captioning
要約 画像キャプション モデルは、入力画像の自然言語による説明を提供することで、 … 続きを読む
Revising Image-Text Retrieval via Multi-Modal Entailment
要約 優れた画像テキスト検索モデルは、高品質のラベル付きデータに依存しています。 … 続きを読む
SWEM: Towards Real-Time Video Object Segmentation with Sequential Weighted Expectation-Maximization
要約 マッチングベースの方法、特に時空間メモリに基づく方法は、半教師付きビデオ … 続きを読む
カテゴリー: cs.CV
SWEM: Towards Real-Time Video Object Segmentation with Sequential Weighted Expectation-Maximization はコメントを受け付けていません
Rethinking Knowledge Distillation via Cross-Entropy
要約 Knowledge Distillation (KD) は広範囲に開発され … 続きを読む
カテゴリー: cs.CV
Rethinking Knowledge Distillation via Cross-Entropy はコメントを受け付けていません
Unsupervised Prompt Learning for Vision-Language Models
要約 CLIP のような対照的な視覚言語モデルは、転移学習において大きな進歩を遂 … 続きを読む
カテゴリー: cs.CV
Unsupervised Prompt Learning for Vision-Language Models はコメントを受け付けていません
STS: Surround-view Temporal Stereo for Multi-view 3D Detection
要約 マルチビュー 3D オブジェクト検出には、正確な深度を学習することが不可欠 … 続きを読む
カテゴリー: cs.CV
STS: Surround-view Temporal Stereo for Multi-view 3D Detection はコメントを受け付けていません
Meta-Causal Feature Learning for Out-of-Distribution Generalization
要約 因果推論は、不変の特徴を抽出することを目的とした分布外 (OOD) 一般化 … 続きを読む
カテゴリー: cs.CV
Meta-Causal Feature Learning for Out-of-Distribution Generalization はコメントを受け付けていません
TEyeD: Over 20 million real-world eye images with Pupil, Eyelid, and Iris 2D and 3D Segmentations, 2D and 3D Landmarks, 3D Eyeball, Gaze Vector, and Eye Movement Types
要約 ヘッドマウント デバイスで撮影された目の画像の世界最大の統合公開データ セ … 続きを読む
Prompt-Matched Semantic Segmentation
要約 この作業の目的は、事前トレーニング済みの基盤モデルを、画像セマンティック … 続きを読む
カテゴリー: cs.CV
Prompt-Matched Semantic Segmentation はコメントを受け付けていません
Non-generative Generalized Zero-shot Learning via Task-correlated Disentanglement and Controllable Samples Synthesis
要約 現在、疑似サンプルの合成は、一般化ゼロショット学習 (GZSL) 問題を解 … 続きを読む
カテゴリー: cs.CV
Non-generative Generalized Zero-shot Learning via Task-correlated Disentanglement and Controllable Samples Synthesis はコメントを受け付けていません