月別アーカイブ: 2025年5月

VidMuse: A Simple Video-to-Music Generation Framework with Long-Short-Term Modeling

要約 この作業では、ビデオのみで条件付けられた音楽生成を体系的に研究しています。 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.MM, cs.SD | VidMuse: A Simple Video-to-Music Generation Framework with Long-Short-Term Modeling はコメントを受け付けていません

RAFT: Robust Augmentation of FeaTures for Image Segmentation

要約 画像セグメンテーションは、シーンの理解のための強力なコンピュータービジョン … 続きを読む

カテゴリー: cs.CV | RAFT: Robust Augmentation of FeaTures for Image Segmentation はコメントを受け付けていません

Registration of 3D Point Sets Using Exponential-based Similarity Matrix

要約 ポイントクラウド登録は、コンピュータービジョンとロボット工学の根本的な問題 … 続きを読む

カテゴリー: cs.CV | Registration of 3D Point Sets Using Exponential-based Similarity Matrix はコメントを受け付けていません

LLM2CLIP: Powerful Language Model Unlocks Richer Visual Representation

要約 Clipは、大規模な画像テキストペアの対照学習を介して、画像とテキスト機能 … 続きを読む

カテゴリー: cs.CL, cs.CV | LLM2CLIP: Powerful Language Model Unlocks Richer Visual Representation はコメントを受け付けていません

Enhancing Virtual Try-On with Synthetic Pairs and Error-Aware Noise Scheduling

要約 標準的な製品ビューの孤立した衣服の画像と人の別の画像を考えると、仮想トライ … 続きを読む

カテゴリー: cs.CV | Enhancing Virtual Try-On with Synthetic Pairs and Error-Aware Noise Scheduling はコメントを受け付けていません

Efficiency Meets Fidelity: A Novel Quantization Framework for Stable Diffusion

要約 安定した拡散モデル(SDM)を介したテキストから画像の生成は、顕著な能力を … 続きを読む

カテゴリー: cs.CV | Efficiency Meets Fidelity: A Novel Quantization Framework for Stable Diffusion はコメントを受け付けていません

Componential Prompt-Knowledge Alignment for Domain Incremental Learning

要約 ドメイン増分学習(DIL)は、過去の知識を保持および利用しながら、ドメイン … 続きを読む

カテゴリー: cs.CV, cs.LG | Componential Prompt-Knowledge Alignment for Domain Incremental Learning はコメントを受け付けていません

Active Sampling for MRI-based Sequential Decision Making

要約 磁気共鳴画像法(MRI)の優れた診断能力にもかかわらず、ポイントオブケア( … 続きを読む

カテゴリー: cs.CV, cs.LG | Active Sampling for MRI-based Sequential Decision Making はコメントを受け付けていません

TetWeave: Isosurface Extraction using On-The-Fly Delaunay Tetrahedral Grids for Gradient-Based Mesh Optimization

要約 Tetweaveを紹介します。Tetweaveは、四面体の行進に使用される … 続きを読む

カテゴリー: cs.CV, cs.GR, I.3.5 | TetWeave: Isosurface Extraction using On-The-Fly Delaunay Tetrahedral Grids for Gradient-Based Mesh Optimization はコメントを受け付けていません

MonoCoP: Chain-of-Prediction for Monocular 3D Object Detection

要約 3D属性を正確に予測することは、単眼3Dオブジェクト検出(Mono3D)に … 続きを読む

カテゴリー: cs.CV | MonoCoP: Chain-of-Prediction for Monocular 3D Object Detection はコメントを受け付けていません