月別アーカイブ: 2025年2月

Action-based image editing guided by human instructions

要約 テキストベースの画像編集は、通常、人間の指示に基づいて入力画像の要素を挿入 … 続きを読む

カテゴリー: cs.CV | Action-based image editing guided by human instructions はコメントを受け付けていません

Field Matching: an Electrostatic Paradigm to Generate and Transfer Data

要約 我々は、静電場マッチング(EFM)を提案する。これは、生成モデリングと分配 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Field Matching: an Electrostatic Paradigm to Generate and Transfer Data はコメントを受け付けていません

MaintaAvatar: A Maintainable Avatar Based on Neural Radiance Fields by Continual Learning

要約 バーチャルデジタルアバターの生成は、コンピュータビジョンの分野において極め … 続きを読む

カテゴリー: cs.AI, cs.CV | MaintaAvatar: A Maintainable Avatar Based on Neural Radiance Fields by Continual Learning はコメントを受け付けていません

Covariances for Free: Exploiting Mean Distributions for Federated Learning with Pre-Trained Models

要約 事前に訓練されたモデルを使用することで、データの不均一性の影響を軽減し、連 … 続きを読む

カテゴリー: cs.CV, cs.LG | Covariances for Free: Exploiting Mean Distributions for Federated Learning with Pre-Trained Models はコメントを受け付けていません

Video Latent Flow Matching: Optimal Polynomial Projections for Video Interpolation and Extrapolation

要約 本論文では、Video Latent Flow Matching (VLF … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Video Latent Flow Matching: Optimal Polynomial Projections for Video Interpolation and Extrapolation はコメントを受け付けていません

ControlFace: Harnessing Facial Parametric Control for Face Rigging

要約 ポーズ、表情、照明などの特定の制御を満たすための顔画像の操作は、顔のリギン … 続きを読む

カテゴリー: cs.CV | ControlFace: Harnessing Facial Parametric Control for Face Rigging はコメントを受け付けていません

LV-XAttn: Distributed Cross-Attention for Long Visual Inputs in Multimodal Large Language Models

要約 クロスアテンションは、視覚情報を言語バックボーンに統合するために、マルチモ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.DC, cs.LG | LV-XAttn: Distributed Cross-Attention for Long Visual Inputs in Multimodal Large Language Models はコメントを受け付けていません

Extending SEEDS to a Supervoxel Algorithm for Medical Image Analysis

要約 この研究では、SEEDSスーパーピクセルアルゴリズムを2D画像から3Dボリ … 続きを読む

カテゴリー: cs.CV | Extending SEEDS to a Supervoxel Algorithm for Medical Image Analysis はコメントを受け付けていません

GAN-Based Architecture for Low-dose Computed Tomography Imaging Denoising

要約 Generative Adversarial Networks(GAN)は … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | GAN-Based Architecture for Low-dose Computed Tomography Imaging Denoising はコメントを受け付けていません

DCBM: Data-Efficient Visual Concept Bottleneck Models

要約 概念ボトルネックモデル(CBM)は、人間が理解可能な概念に基づいて予測を行 … 続きを読む

カテゴリー: cs.CV | DCBM: Data-Efficient Visual Concept Bottleneck Models はコメントを受け付けていません