月別アーカイブ: 2025年4月

MAD: Makeup All-in-One with Cross-Domain Diffusion Model

要約 既存のメイクアップ技術では、異なる入力を処理するために複数のモデルを設計し … 続きを読む

カテゴリー: cs.CV | MAD: Makeup All-in-One with Cross-Domain Diffusion Model はコメントを受け付けていません

Noise Calibration and Spatial-Frequency Interactive Network for STEM Image Enhancement

要約 走査型透過電子顕微鏡(STEM)は、原子配列をサブオングストローム分解能で … 続きを読む

カテゴリー: cs.CV | Noise Calibration and Spatial-Frequency Interactive Network for STEM Image Enhancement はコメントを受け付けていません

Rip Current Segmentation: A Novel Benchmark and YOLOv8 Baseline Results

要約 離岸流は、世界中の多くの海岸で死亡事故や負傷の主な原因となっており、このよ … 続きを読む

カテゴリー: cs.AI, cs.CV, I.4.0 | Rip Current Segmentation: A Novel Benchmark and YOLOv8 Baseline Results はコメントを受け付けていません

L-LBVC: Long-Term Motion Estimation and Prediction for Learned Bi-Directional Video Compression

要約 近年、学習型ビデオ圧縮(LVC)が低遅延構成で優れた性能を示すようになった … 続きを読む

カテゴリー: cs.CV, cs.MM | L-LBVC: Long-Term Motion Estimation and Prediction for Learned Bi-Directional Video Compression はコメントを受け付けていません

MedConv: Convolutions Beat Transformers on Long-Tailed Bone Density Prediction

要約 Tスコアを推定するためのCTスキャンによる骨密度予測は極めて重要であり、空 … 続きを読む

カテゴリー: cs.CV | MedConv: Convolutions Beat Transformers on Long-Tailed Bone Density Prediction はコメントを受け付けていません

Rethinking RL Scaling for Vision Language Models: A Transparent, From-Scratch Framework and Comprehensive Evaluation Scheme

要約 強化学習(RL)は、近年、大規模言語モデルの推論能力を向上させる強い可能性 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | Rethinking RL Scaling for Vision Language Models: A Transparent, From-Scratch Framework and Comprehensive Evaluation Scheme はコメントを受け付けていません

Object-Centric 2D Gaussian Splatting: Background Removal and Occlusion-Aware Pruning for Compact Object Models

要約 現在のガウススプラッティングアプローチは、シーン全体の再構成には有効である … 続きを読む

カテゴリー: cs.CV | Object-Centric 2D Gaussian Splatting: Background Removal and Occlusion-Aware Pruning for Compact Object Models はコメントを受け付けていません

Leveraging Sparse Annotations for Leukemia Diagnosis on the Large Leukemia Dataset

要約 白血病は10番目に多く診断される癌であり、世界中で癌関連死の主要な原因の一 … 続きを読む

カテゴリー: cs.CV | Leveraging Sparse Annotations for Leukemia Diagnosis on the Large Leukemia Dataset はコメントを受け付けていません

TAMT: Temporal-Aware Model Tuning for Cross-Domain Few-Shot Action Recognition

要約 数ショット行動認識(FSAR)を超えて、クロスドメインFSAR(CDFSA … 続きを読む

カテゴリー: cs.CV | TAMT: Temporal-Aware Model Tuning for Cross-Domain Few-Shot Action Recognition はコメントを受け付けていません

Fine-Tuning Visual Autoregressive Models for Subject-Driven Generation

要約 テキストから画像への生成モデルにおける最近の進歩は、わずかな例から被験者の … 続きを読む

カテゴリー: cs.CV | Fine-Tuning Visual Autoregressive Models for Subject-Driven Generation はコメントを受け付けていません