月別アーカイブ: 2023年8月

WanJuan: A Comprehensive Multimodal Dataset for Advancing English and Chinese Large Models

要約 ChatGPT と GPT-4 の人気の高まりにより、大規模モデルの開発が … 続きを読む

カテゴリー: cs.CL, cs.CV | WanJuan: A Comprehensive Multimodal Dataset for Advancing English and Chinese Large Models はコメントを受け付けていません

Self-supervised Hypergraphs for Learning Multiple World Interpretations

要約 我々は、マルチタスク ハイパーグラフの形式でそのような表現間の関係を利用す … 続きを読む

カテゴリー: cs.CV | Self-supervised Hypergraphs for Learning Multiple World Interpretations はコメントを受け付けていません

CoNe: Contrast Your Neighbours for Supervised Image Classification

要約 画像分類は、コンピューター ビジョンと機械学習の研究における長年の問題です … 続きを読む

カテゴリー: cs.CV | CoNe: Contrast Your Neighbours for Supervised Image Classification はコメントを受け付けていません

Sound Localization from Motion: Jointly Learning Sound Direction and Camera Rotation

要約 私たちが知覚する画像と音は、頭を回転させると、微妙ですが幾何学的に一貫した … 続きを読む

カテゴリー: cs.CV, cs.SD, eess.AS | Sound Localization from Motion: Jointly Learning Sound Direction and Camera Rotation はコメントを受け付けていません

SatlasPretrain: A Large-Scale Dataset for Remote Sensing Image Understanding

要約 リモート センシング画像は、森林伐採の追跡から違法漁業への取り組みまで、さ … 続きを読む

カテゴリー: cs.CV | SatlasPretrain: A Large-Scale Dataset for Remote Sensing Image Understanding はコメントを受け付けていません

Dense Error Map Estimation for MRI-Ultrasound Registration in Brain Tumor Surgery Using Swin UNETR

要約 脳腫瘍の早期外科的治療は、患者の死亡率を下げるために重要です。 ただし、手 … 続きを読む

カテゴリー: cs.CV, eess.IV | Dense Error Map Estimation for MRI-Ultrasound Registration in Brain Tumor Surgery Using Swin UNETR はコメントを受け付けていません

One-Vote Veto: Semi-Supervised Learning for Low-Shot Glaucoma Diagnosis

要約 畳み込みニューラル ネットワーク (CNN) は、眼底の画像から緑内障を自 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | One-Vote Veto: Semi-Supervised Learning for Low-Shot Glaucoma Diagnosis はコメントを受け付けていません

WeditGAN: Few-shot Image Generation via Latent Space Relocation

要約 少数ショットの画像生成では、ほんの少数の画像で GAN モデルを直接トレー … 続きを読む

カテゴリー: cs.CV | WeditGAN: Few-shot Image Generation via Latent Space Relocation はコメントを受け付けていません

Extraction of Text from Optic Nerve Optical Coherence Tomography Reports

要約 目的: この研究の目的は、Zeiss Cirrus 光コヒーレンストモグラ … 続きを読む

カテゴリー: cs.CV, eess.IV | Extraction of Text from Optic Nerve Optical Coherence Tomography Reports はコメントを受け付けていません

MGMAE: Motion Guided Masking for Video Masked Autoencoding

要約 マスクされた自動エンコーディングは、自己教師ありビデオ表現学習において優れ … 続きを読む

カテゴリー: cs.CV, cs.LG | MGMAE: Motion Guided Masking for Video Masked Autoencoding はコメントを受け付けていません