-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2023年2月
DDM$^2$: Self-Supervised Diffusion MRI Denoising with Generative Diffusion Models
要約 磁気共鳴イメージング(MRI)は、一般的で命を救う医療画像技術である。しか … 続きを読む
RLSbench: Domain Adaptation Under Relaxed Label Shift
要約 ラベルシフト下でのドメイン適応のための原理的な方法が出現しているにもかかわ … 続きを読む
SurgT: Soft-Tissue Tracking for Robotic Surgery, Benchmark and Challenge
要約 本稿では、SurgT MICCAI 2022チャレンジとその最初の結果につ … 続きを読む
V1T: large-scale mouse V1 response prediction using a Vision Transformer
要約 視覚刺激に対する視覚野の神経応答を正確に予測するモデルは、計算論的神経科学 … 続きを読む
AIM: Adapting Image Models for Efficient Video Action Recognition
要約 近年の視覚変換器を用いた映像モデルは、「画像事前学習→微調整」のパラダイム … 続きを読む
カテゴリー: cs.CV
AIM: Adapting Image Models for Efficient Video Action Recognition はコメントを受け付けていません
Zero-shot Image-to-Image Translation
要約 大規模なテキスト画像生成モデルは、多様で高品質な画像を合成するための顕著な … 続きを読む
The Learnable Typewriter: A Generative Approach to Text Line Analysis
要約 我々は、テキスト行の文字解析と認識に対する生成的な文書固有のアプローチを提 … 続きを読む
カテゴリー: cs.CV
The Learnable Typewriter: A Generative Approach to Text Line Analysis はコメントを受け付けていません
Show me your NFT and I tell you how it will perform: Multimodal representation learning for NFT selling price prediction
要約 Non-Fungible Token(NFT)は、ブロックチェーン技術とス … 続きを読む
Language Quantized AutoEncoders: Towards Unsupervised Text-Image Alignment
要約 近年、大規模言語モデルの拡張が進み、テキストベースの様々なタスクにおいて数 … 続きを読む
Bridging the Emotional Semantic Gap via Multimodal Relevance Estimation
要約 人間は、表情、音声、自然言語など、豊かな感情表現手段を持っている。しかし、 … 続きを読む