cs.CV」カテゴリーアーカイブ

GEXIA: Granularity Expansion and Iterative Approximation for Scalable Multi-grained Video-language Learning

要約 さまざまなビデオ言語学習タスクにおいて、マルチグレイン データを使用してク … 続きを読む

カテゴリー: cs.CV | GEXIA: Granularity Expansion and Iterative Approximation for Scalable Multi-grained Video-language Learning はコメントを受け付けていません

Why Fine-grained Labels in Pretraining Benefit Generalization?

要約 最近の研究では、きめの細かいラベル付けされたデータを使用してディープ ニュ … 続きを読む

カテゴリー: cs.CV, cs.LG, stat.ML | Why Fine-grained Labels in Pretraining Benefit Generalization? はコメントを受け付けていません

ACDiT: Interpolating Autoregressive Conditional Modeling and Diffusion Transformer

要約 最近、包括的なマルチモーダル モデルへの関心が高まっているため、多様なモダ … 続きを読む

カテゴリー: cs.CV | ACDiT: Interpolating Autoregressive Conditional Modeling and Diffusion Transformer はコメントを受け付けていません

ObjCtrl-2.5D: Training-free Object Control with Camera Poses

要約 この研究は、画像からビデオ (I2V) 生成において、より正確で多用途なオ … 続きを読む

カテゴリー: cs.CV | ObjCtrl-2.5D: Training-free Object Control with Camera Poses はコメントを受け付けていません

MoRAG — Multi-Fusion Retrieval Augmented Generation for Human Motion

要約 テキストベースの人間のモーション生成のための、新しいマルチパート融合ベース … 続きを読む

カテゴリー: cs.CV, cs.MM | MoRAG — Multi-Fusion Retrieval Augmented Generation for Human Motion はコメントを受け付けていません

STIV: Scalable Text and Image Conditioned Video Generation

要約 ビデオ生成の分野は目覚ましい進歩を遂げていますが、堅牢でスケーラブルなモデ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | STIV: Scalable Text and Image Conditioned Video Generation はコメントを受け付けていません

SKIPNet: Spatial Attention Skip Connections for Enhanced Brain Tumor Classification

要約 タイムリーな治療には磁気共鳴画像法(MRI)による脳腫瘍の早期発見が不可欠 … 続きを読む

カテゴリー: cs.CV, eess.IV | SKIPNet: Spatial Attention Skip Connections for Enhanced Brain Tumor Classification はコメントを受け付けていません

GASP: Gaussian Avatars with Synthetic Priors

要約 ガウス スプラッティングは、リアルタイムの写真のようにリアルなレンダリング … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR | GASP: Gaussian Avatars with Synthetic Priors はコメントを受け付けていません

Image Retrieval with Intra-Sweep Representation Learning for Neck Ultrasound Scanning Guidance

要約 目的: 術中超音波 (US) は、経口ロボット手術におけるリアルタイムの視 … 続きを読む

カテゴリー: cs.CV | Image Retrieval with Intra-Sweep Representation Learning for Neck Ultrasound Scanning Guidance はコメントを受け付けていません

M3TR: Generalist HD Map Construction with Variable Map Priors

要約 自動運転車の走行には、通常は HD マップの形式で道路情報が必要です。 オ … 続きを読む

カテゴリー: cs.CV, cs.RO | M3TR: Generalist HD Map Construction with Variable Map Priors はコメントを受け付けていません