cs.CV」カテゴリーアーカイブ

A Reinforcement Learning-Based Automatic Video Editing Method Using Pre-trained Vision-Language Model

要約 このビデオの時代において、自動ビデオ編集技術は、作業負荷を軽減し、人間の編 … 続きを読む

カテゴリー: cs.CV | A Reinforcement Learning-Based Automatic Video Editing Method Using Pre-trained Vision-Language Model はコメントを受け付けていません

GD doesn’t make the cut: Three ways that non-differentiability affects neural network training

要約 この論文では、非微分可能関数 (NGDM) に適用される勾配法と、微分可能 … 続きを読む

カテゴリー: cs.CV, cs.LG | GD doesn’t make the cut: Three ways that non-differentiability affects neural network training はコメントを受け付けていません

M3DocRAG: Multi-modal Retrieval is What You Need for Multi-page Multi-document Understanding

要約 ドキュメントからの質問に答えるドキュメント ビジュアル質問応答 (DocV … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | M3DocRAG: Multi-modal Retrieval is What You Need for Multi-page Multi-document Understanding はコメントを受け付けていません

CAD-MLLM: Unifying Multimodality-Conditioned CAD Generation With MLLM

要約 このペーパーは、テキスト記述、画像、点群、またはそれらの組み合わせの形式で … 続きを読む

カテゴリー: cs.CV | CAD-MLLM: Unifying Multimodality-Conditioned CAD Generation With MLLM はコメントを受け付けていません

Uncovering Hidden Subspaces in Video Diffusion Models Using Re-Identification

要約 潜在ビデオ拡散モデルは、生成された画質と時間的一貫性のおかげで、一般の観察 … 続きを読む

カテゴリー: cs.AI, cs.CV | Uncovering Hidden Subspaces in Video Diffusion Models Using Re-Identification はコメントを受け付けていません

VAIR: Visuo-Acoustic Implicit Representations for Low-Cost, Multi-Modal Transparent Surface Reconstruction in Indoor Scenes

要約 屋内で動作する移動ロボットは、透明な表面を含む困難なシーンをナビゲートでき … 続きを読む

カテゴリー: cs.CV | VAIR: Visuo-Acoustic Implicit Representations for Low-Cost, Multi-Modal Transparent Surface Reconstruction in Indoor Scenes はコメントを受け付けていません

A Comparative Analysis of U-Net-based models for Segmentation of Cardiac MRI

要約 医療画像とは、医学的疾患の診断、監視、さらには治療を目的として、人体とその … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | A Comparative Analysis of U-Net-based models for Segmentation of Cardiac MRI はコメントを受け付けていません

AsCAN: Asymmetric Convolution-Attention Networks for Efficient Recognition and Generation

要約 ニューラル ネットワーク アーキテクチャの設計では、多くの重要な決定を行う … 続きを読む

カテゴリー: cs.CV, cs.LG | AsCAN: Asymmetric Convolution-Attention Networks for Efficient Recognition and Generation はコメントを受け付けていません

Planar Reflection-Aware Neural Radiance Fields

要約 Neural Radiance Fields (NeRF) は、複雑なシー … 続きを読む

カテゴリー: cs.CV | Planar Reflection-Aware Neural Radiance Fields はコメントを受け付けていません

SG-I2V: Self-Guided Trajectory Control in Image-to-Video Generation

要約 画像からビデオへの生成方法は、印象的で写真のようにリアルな品質を実現しまし … 続きを読む

カテゴリー: cs.CV, cs.LG | SG-I2V: Self-Guided Trajectory Control in Image-to-Video Generation はコメントを受け付けていません