月別アーカイブ: 2023年2月

DDM$^2$: Self-Supervised Diffusion MRI Denoising with Generative Diffusion Models

要約 磁気共鳴イメージング(MRI)は、一般的で命を救う医療画像技術である。しか … 続きを読む

カテゴリー: cs.CV, eess.IV | DDM$^2$: Self-Supervised Diffusion MRI Denoising with Generative Diffusion Models はコメントを受け付けていません

RLSbench: Domain Adaptation Under Relaxed Label Shift

要約 ラベルシフト下でのドメイン適応のための原理的な方法が出現しているにもかかわ … 続きを読む

カテゴリー: cs.CV, cs.LG, stat.ML | RLSbench: Domain Adaptation Under Relaxed Label Shift はコメントを受け付けていません

SurgT: Soft-Tissue Tracking for Robotic Surgery, Benchmark and Challenge

要約 本稿では、SurgT MICCAI 2022チャレンジとその最初の結果につ … 続きを読む

カテゴリー: cs.CV, cs.RO, eess.IV | SurgT: Soft-Tissue Tracking for Robotic Surgery, Benchmark and Challenge はコメントを受け付けていません

V1T: large-scale mouse V1 response prediction using a Vision Transformer

要約 視覚刺激に対する視覚野の神経応答を正確に予測するモデルは、計算論的神経科学 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.NE, q-bio.NC | V1T: large-scale mouse V1 response prediction using a Vision Transformer はコメントを受け付けていません

AIM: Adapting Image Models for Efficient Video Action Recognition

要約 近年の視覚変換器を用いた映像モデルは、「画像事前学習→微調整」のパラダイム … 続きを読む

カテゴリー: cs.CV | AIM: Adapting Image Models for Efficient Video Action Recognition はコメントを受け付けていません

Zero-shot Image-to-Image Translation

要約 大規模なテキスト画像生成モデルは、多様で高品質な画像を合成するための顕著な … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.LG | Zero-shot Image-to-Image Translation はコメントを受け付けていません

The Learnable Typewriter: A Generative Approach to Text Line Analysis

要約 我々は、テキスト行の文字解析と認識に対する生成的な文書固有のアプローチを提 … 続きを読む

カテゴリー: cs.CV | The Learnable Typewriter: A Generative Approach to Text Line Analysis はコメントを受け付けていません

Show me your NFT and I tell you how it will perform: Multimodal representation learning for NFT selling price prediction

要約 Non-Fungible Token(NFT)は、ブロックチェーン技術とス … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.NE | Show me your NFT and I tell you how it will perform: Multimodal representation learning for NFT selling price prediction はコメントを受け付けていません

Language Quantized AutoEncoders: Towards Unsupervised Text-Image Alignment

要約 近年、大規模言語モデルの拡張が進み、テキストベースの様々なタスクにおいて数 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | Language Quantized AutoEncoders: Towards Unsupervised Text-Image Alignment はコメントを受け付けていません

Bridging the Emotional Semantic Gap via Multimodal Relevance Estimation

要約 人間は、表情、音声、自然言語など、豊かな感情表現手段を持っている。しかし、 … 続きを読む

カテゴリー: cs.AI, cs.CV | Bridging the Emotional Semantic Gap via Multimodal Relevance Estimation はコメントを受け付けていません