「cs.CV」カテゴリーアーカイブ

GEXIA: Granularity Expansion and Iterative Approximation for Scalable Multi-grained Video-language Learning

投稿日: 2024年12月11日作成者: jarxiv

要約さまざまなビデオ言語学習タスクにおいて、マルチグレインデータを使用してク … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Why Fine-grained Labels in Pretraining Benefit Generalization?

投稿日: 2024年12月11日作成者: jarxiv

要約最近の研究では、きめの細かいラベル付けされたデータを使用してディープニュ … 続きを読む →

カテゴリー: cs.CV, cs.LG, stat.ML | コメントを受け付けていません

ACDiT: Interpolating Autoregressive Conditional Modeling and Diffusion Transformer

投稿日: 2024年12月11日作成者: jarxiv

要約最近、包括的なマルチモーダルモデルへの関心が高まっているため、多様なモダ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

ObjCtrl-2.5D: Training-free Object Control with Camera Poses

投稿日: 2024年12月11日作成者: jarxiv

要約この研究は、画像からビデオ (I2V) 生成において、より正確で多用途なオ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

MoRAG — Multi-Fusion Retrieval Augmented Generation for Human Motion

投稿日: 2024年12月11日作成者: jarxiv

要約テキストベースの人間のモーション生成のための、新しいマルチパート融合ベース … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

STIV: Scalable Text and Image Conditioned Video Generation

投稿日: 2024年12月11日作成者: jarxiv

要約ビデオ生成の分野は目覚ましい進歩を遂げていますが、堅牢でスケーラブルなモデ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | コメントを受け付けていません

SKIPNet: Spatial Attention Skip Connections for Enhanced Brain Tumor Classification

投稿日: 2024年12月11日作成者: jarxiv

要約タイムリーな治療には磁気共鳴画像法（MRI）による脳腫瘍の早期発見が不可欠 … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

GASP: Gaussian Avatars with Synthetic Priors

投稿日: 2024年12月11日作成者: jarxiv

要約ガウススプラッティングは、リアルタイムの写真のようにリアルなレンダリング … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.GR | コメントを受け付けていません

Image Retrieval with Intra-Sweep Representation Learning for Neck Ultrasound Scanning Guidance

投稿日: 2024年12月11日作成者: jarxiv

要約目的: 術中超音波 (US) は、経口ロボット手術におけるリアルタイムの視 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

M3TR: Generalist HD Map Construction with Variable Map Priors

投稿日: 2024年12月11日作成者: jarxiv

要約自動運転車の走行には、通常は HD マップの形式で道路情報が必要です。オ … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

GEXIA: Granularity Expansion and Iterative Approximation for Scalable Multi-grained Video-language Learning

Why Fine-grained Labels in Pretraining Benefit Generalization?

ACDiT: Interpolating Autoregressive Conditional Modeling and Diffusion Transformer

ObjCtrl-2.5D: Training-free Object Control with Camera Poses

MoRAG — Multi-Fusion Retrieval Augmented Generation for Human Motion

STIV: Scalable Text and Image Conditioned Video Generation

SKIPNet: Spatial Attention Skip Connections for Enhanced Brain Tumor Classification

GASP: Gaussian Avatars with Synthetic Priors

Image Retrieval with Intra-Sweep Representation Learning for Neck Ultrasound Scanning Guidance

M3TR: Generalist HD Map Construction with Variable Map Priors

最近の投稿

最近のコメント

アーカイブ

カテゴリー