cs.CV」カテゴリーアーカイブ

Transfer Risk Map: Mitigating Pixel-level Negative Transfer in Medical Segmentation

要約 転移学習における負の転移をどのように軽減するかは、特に医用画像セグメンテー … 続きを読む

カテゴリー: cs.CV | Transfer Risk Map: Mitigating Pixel-level Negative Transfer in Medical Segmentation はコメントを受け付けていません

Test Time Training for 4D Medical Image Interpolation

要約 4次元医用画像補間は、臨床応用における時間分解能と診断精度の向上に不可欠で … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | Test Time Training for 4D Medical Image Interpolation はコメントを受け付けていません

MotionLab: Unified Human Motion Generation and Editing via the Motion-Condition-Motion Paradigm

要約 ヒューマンモーションの生成と編集は、コンピュータグラフィックスとビジョンの … 続きを読む

カテゴリー: cs.CV | MotionLab: Unified Human Motion Generation and Editing via the Motion-Condition-Motion Paradigm はコメントを受け付けていません

Action-based image editing guided by human instructions

要約 テキストベースの画像編集は、通常、人間の指示に基づいて入力画像の要素を挿入 … 続きを読む

カテゴリー: cs.CV | Action-based image editing guided by human instructions はコメントを受け付けていません

Field Matching: an Electrostatic Paradigm to Generate and Transfer Data

要約 我々は、静電場マッチング(EFM)を提案する。これは、生成モデリングと分配 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Field Matching: an Electrostatic Paradigm to Generate and Transfer Data はコメントを受け付けていません

MaintaAvatar: A Maintainable Avatar Based on Neural Radiance Fields by Continual Learning

要約 バーチャルデジタルアバターの生成は、コンピュータビジョンの分野において極め … 続きを読む

カテゴリー: cs.AI, cs.CV | MaintaAvatar: A Maintainable Avatar Based on Neural Radiance Fields by Continual Learning はコメントを受け付けていません

Covariances for Free: Exploiting Mean Distributions for Federated Learning with Pre-Trained Models

要約 事前に訓練されたモデルを使用することで、データの不均一性の影響を軽減し、連 … 続きを読む

カテゴリー: cs.CV, cs.LG | Covariances for Free: Exploiting Mean Distributions for Federated Learning with Pre-Trained Models はコメントを受け付けていません

Video Latent Flow Matching: Optimal Polynomial Projections for Video Interpolation and Extrapolation

要約 本論文では、Video Latent Flow Matching (VLF … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Video Latent Flow Matching: Optimal Polynomial Projections for Video Interpolation and Extrapolation はコメントを受け付けていません

ControlFace: Harnessing Facial Parametric Control for Face Rigging

要約 ポーズ、表情、照明などの特定の制御を満たすための顔画像の操作は、顔のリギン … 続きを読む

カテゴリー: cs.CV | ControlFace: Harnessing Facial Parametric Control for Face Rigging はコメントを受け付けていません

LV-XAttn: Distributed Cross-Attention for Long Visual Inputs in Multimodal Large Language Models

要約 クロスアテンションは、視覚情報を言語バックボーンに統合するために、マルチモ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.DC, cs.LG | LV-XAttn: Distributed Cross-Attention for Long Visual Inputs in Multimodal Large Language Models はコメントを受け付けていません