投稿者「jarxiv」のアーカイブ

Using Foundation Models as Pseudo-Label Generators for Pre-Clinical 4D Cardiac CT Segmentation

要約 心臓画像のセグメンテーションは、多くの心臓画像分析と、心臓力学のモーション … 続きを読む

カテゴリー: cs.CV | Using Foundation Models as Pseudo-Label Generators for Pre-Clinical 4D Cardiac CT Segmentation はコメントを受け付けていません

Meta-learning Slice-to-Volume Reconstruction in Fetal Brain MRI using Implicit Neural Representations

要約 複数の動き腐敗した低解像度2Dスライスからの高解像度スライスから容積再構成 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | Meta-learning Slice-to-Volume Reconstruction in Fetal Brain MRI using Implicit Neural Representations はコメントを受け付けていません

BLIP3-o: A Family of Fully Open Unified Multimodal Models-Architecture, Training and Dataset

要約 統一された画像の理解と生成は、マルチモーダルモデルに関する最近の研究で注目 … 続きを読む

カテゴリー: cs.AI, cs.CV | BLIP3-o: A Family of Fully Open Unified Multimodal Models-Architecture, Training and Dataset はコメントを受け付けていません

Don’t Forget your Inverse DDIM for Image Editing

要約 テキストからイメージの生成の分野は、拡散モデルの導入により大きな進歩を遂げ … 続きを読む

カテゴリー: cs.CV, I.2.10 | Don’t Forget your Inverse DDIM for Image Editing はコメントを受け付けていません

Optimal-state Dynamics Estimation for Physics-based Human Motion Capture from Videos

要約 単眼ビデオからの人間のモーションキャプチャは、近年大きな進歩を遂げています … 続きを読む

カテゴリー: cs.CV | Optimal-state Dynamics Estimation for Physics-based Human Motion Capture from Videos はコメントを受け付けていません

Variational Visual Question Answering

要約 視覚的な質問応答(VQA)のマルチモーダルモデルでは顕著な進歩にもかかわら … 続きを読む

カテゴリー: cs.AI, cs.CV | Variational Visual Question Answering はコメントを受け付けていません

Embodied-Reasoner: Synergizing Visual Search, Reasoning, and Action for Embodied Interactive Tasks

要約 深い思考モデルの最近の進歩により、数学的およびコーディングタスクに関する顕 … 続きを読む

カテゴリー: cs.CL, cs.CV | Embodied-Reasoner: Synergizing Visual Search, Reasoning, and Action for Embodied Interactive Tasks はコメントを受け付けていません

LightLab: Controlling Light Sources in Images with Diffusion Models

要約 画像内の光源に対するきめの細かいパラメトリック制御のためのシンプルでありな … 続きを読む

カテゴリー: cs.CV, cs.GR | LightLab: Controlling Light Sources in Images with Diffusion Models はコメントを受け付けていません

UWAV: Uncertainty-weighted Weakly-supervised Audio-Visual Video Parsing

要約 オーディオビジュアルビデオの解析(AVVP)は、両方のユニモーダルイベント … 続きを読む

カテゴリー: cs.CV, cs.SD, eess.AS | UWAV: Uncertainty-weighted Weakly-supervised Audio-Visual Video Parsing はコメントを受け付けていません

Sensitivity-Constrained Fourier Neural Operators for Forward and Inverse Problems in Parametric Differential Equations

要約 du/dt = f(u、x、t、p)の形式のパラメトリック微分方程式は、科 … 続きを読む

カテゴリー: cs.CE, cs.LG | Sensitivity-Constrained Fourier Neural Operators for Forward and Inverse Problems in Parametric Differential Equations はコメントを受け付けていません