月別アーカイブ: 2023年6月

M$^3$IT: A Large-Scale Dataset towards Multi-Modal Multilingual Instruction Tuning

要約 命令チューニングでは、ChatGPT などの大規模言語モデル (LLM) … 続きを読む

カテゴリー: cs.CL, cs.CV | M$^3$IT: A Large-Scale Dataset towards Multi-Modal Multilingual Instruction Tuning はコメントを受け付けていません

Improving Diffusion-based Image Translation using Asymmetric Gradient Guidance

要約 最近、拡散モデルは画像翻訳タスクにおいて大きな進歩を示しています。 ただし … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, stat.ML | Improving Diffusion-based Image Translation using Asymmetric Gradient Guidance はコメントを受け付けていません

GPT4Image: Can Large Pre-trained Models Help Vision Models on Perception Tasks?

要約 最近の事前トレーニング済みの大規模モデル (GPT-4 など) の急増は、 … 続きを読む

カテゴリー: cs.CV | GPT4Image: Can Large Pre-trained Models Help Vision Models on Perception Tasks? はコメントを受け付けていません

Introduction to Medical Imaging Informatics

要約 医用画像情報学は、医用画像と情報学の原理を組み合わせて医用画像の取得、管理 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Introduction to Medical Imaging Informatics はコメントを受け付けていません

FoSp: Focus and Separation Network for Early Smoke Segmentation

要約 早期煙分別 (ESS) により、煙の発生源を正確に特定できるため、火災の迅 … 続きを読む

カテゴリー: cs.CV | FoSp: Focus and Separation Network for Early Smoke Segmentation はコメントを受け付けていません

FPUS23: An Ultrasound Fetus Phantom Dataset with Deep Neural Network Evaluations for Fetus Orientations, Fetal Planes, and Anatomical Features

要約 超音波画像処理は、妊娠中の胎児の成長、進行、全体的な健康状態を評価するため … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | FPUS23: An Ultrasound Fetus Phantom Dataset with Deep Neural Network Evaluations for Fetus Orientations, Fetal Planes, and Anatomical Features はコメントを受け付けていません

Rewarded soups: towards Pareto-optimal alignment by interpolating weights fine-tuned on diverse rewards

要約 基礎モデルは、まず広大な教師なしデータセットで事前トレーニングされ、次にラ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Rewarded soups: towards Pareto-optimal alignment by interpolating weights fine-tuned on diverse rewards はコメントを受け付けていません

Defocus to focus: Photo-realistic bokeh rendering by fusing defocus and radiance priors

要約 単一の焦点の合った画像からリアルなボケをレンダリングする問題を検討します。 … 続きを読む

カテゴリー: cs.CV | Defocus to focus: Photo-realistic bokeh rendering by fusing defocus and radiance priors はコメントを受け付けていません

Improving neural network representations using human similarity judgments

要約 ディープ ニューラル ネットワークは、多くのコンピューター ビジョン タス … 続きを読む

カテゴリー: cs.CV, cs.LG | Improving neural network representations using human similarity judgments はコメントを受け付けていません

Cross-attention learning enables real-time nonuniform rotational distortion correction in OCT

要約 不均一回転歪み (NURD) 補正は、内視鏡光干渉断層撮影 (OCT) イ … 続きを読む

カテゴリー: cs.CV, eess.IV, physics.med-ph | Cross-attention learning enables real-time nonuniform rotational distortion correction in OCT はコメントを受け付けていません