-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2022年9月
Levenshtein OCR
要約 Vision-Language Transformer (VLT)に基づく … 続きを読む
カテゴリー: cs.CV
Levenshtein OCR はコメントを受け付けていません
VICTOR: Visual Incompatibility Detection with Transformers and Fashion-specific contrastive pre-training
要約 ファッションの着こなしが美的であるとみなされるためには、それを構成する衣服 … 続きを読む
nVFNet-RDC: Replay and Non-Local Distillation Collaboration for Continual Object Detection
要約 継続的学習(Continual Learning: CL)は、新しい環境に … 続きを読む
カテゴリー: cs.CV
nVFNet-RDC: Replay and Non-Local Distillation Collaboration for Continual Object Detection はコメントを受け付けていません
TransCrowd: weakly-supervised crowd counting with transformers
要約 群衆計測の主流は、通常、畳み込みニューラルネットワーク(CNN)を利用して … 続きを読む
カテゴリー: cs.CV
TransCrowd: weakly-supervised crowd counting with transformers はコメントを受け付けていません
An Iteratively Optimized Patch Label Inference Network for Automatic Pavement Distress Detection
要約 我々は、ひび割れやポットホールなどの特定のものだけに限定されない様々な舗装 … 続きを読む
カテゴリー: cs.CV
An Iteratively Optimized Patch Label Inference Network for Automatic Pavement Distress Detection はコメントを受け付けていません
Exploring Adversarial Attacks and Defenses in Vision Transformers trained with DINO
要約 本研究では、DINOを用いて学習した自己教師ありVision Transf … 続きを読む
Frame-Subtitle Self-Supervision for Multi-Modal Video Question Answering
要約 マルチモーダルビデオ質問応答は、正解を予測し、質問に関連する時間的境界を局 … 続きを読む
Representing Camera Response Function by a Single Latent Variable and Fully Connected Neural Network
要約 シーン照度から画像強度へのマッピングをモデル化することは、多くのコンピュー … 続きを読む
カテゴリー: cs.CV
Representing Camera Response Function by a Single Latent Variable and Fully Connected Neural Network はコメントを受け付けていません
Application of image-to-image translation in improving pedestrian detection
要約 低照度下では、有効なターゲット領域がないため、歩行者の認識や画像間の変換な … 続きを読む
Positive-Negative Equal Contrastive Loss for Semantic Segmentation
要約 文脈情報は様々なコンピュータビジョンタスクにとって重要であり、これまでの研 … 続きを読む
カテゴリー: cs.CV
Positive-Negative Equal Contrastive Loss for Semantic Segmentation はコメントを受け付けていません