「cs.AI」カテゴリーアーカイブ

CaLa: Complementary Association Learning for Augmenting Composed Image Retrieval

投稿日: 2024年5月30日作成者: jarxiv

要約合成画像検索 (CIR) には、画像とテキストのペアのクエリに基づいてター … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.IR | コメントを受け付けていません

Going beyond compositional generalization, DDPMs can produce zero-shot interpolation

投稿日: 2024年5月30日作成者: jarxiv

要約ノイズ除去拡散確率モデル (DDPM) は画像生成において顕著な機能を示し … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.NE | コメントを受け付けていません

VideoTree: Adaptive Tree-based Video Representation for LLM Reasoning on Long Videos

投稿日: 2024年5月30日作成者: jarxiv

要約ビデオ言語を理解するタスクは短いビデオクリップに焦点を当てており、多くの … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

Intelligent Anomaly Detection for Lane Rendering Using Transformer with Self-Supervised Pre-Training and Customized Fine-Tuning

投稿日: 2024年5月30日作成者: jarxiv

要約デジタル地図を使用したナビゲーションサービスの急増は、ドライバーに大きな … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, eess.IV, stat.ML | コメントを受け付けていません

Track Anything Rapter(TAR)

投稿日: 2024年5月30日作成者: jarxiv

要約オブジェクト追跡は、交通監視、ロボティクス、自動車両追跡など、さまざまな領 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

ConceptPrune: Concept Editing in Diffusion Models via Skilled Neuron Pruning

投稿日: 2024年5月30日作成者: jarxiv

要約大規模なテキストから画像への拡散モデルは、優れた画像生成機能を実証していま … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Neural Isometries: Taming Transformations for Equivariant ML

投稿日: 2024年5月30日作成者: jarxiv

要約現実世界のジオメトリと 3D ビジョンのタスクには、扱いやすい分析表現を妨 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG | コメントを受け付けていません

NPGA: Neural Parametric Gaussian Avatars

投稿日: 2024年5月30日作成者: jarxiv

要約人間の頭の高忠実度のデジタルバージョンの作成は、仮想コンポーネントを私た … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.GR | コメントを受け付けていません

LLMs Meet Multimodal Generation and Editing: A Survey

投稿日: 2024年5月30日作成者: jarxiv

要約大規模言語モデル (LLM) の最近の進歩により、LLM とマルチモーダル … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

Instruct-MusicGen: Unlocking Text-to-Music Editing for Music Language Models via Instruction Tuning

投稿日: 2024年5月30日作成者: jarxiv

要約テキストから音楽への編集における最近の進歩は、テキストクエリを使用して音 … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

CaLa: Complementary Association Learning for Augmenting Composed Image Retrieval

Going beyond compositional generalization, DDPMs can produce zero-shot interpolation

VideoTree: Adaptive Tree-based Video Representation for LLM Reasoning on Long Videos

Intelligent Anomaly Detection for Lane Rendering Using Transformer with Self-Supervised Pre-Training and Customized Fine-Tuning

Track Anything Rapter(TAR)

ConceptPrune: Concept Editing in Diffusion Models via Skilled Neuron Pruning

Neural Isometries: Taming Transformations for Equivariant ML

NPGA: Neural Parametric Gaussian Avatars

LLMs Meet Multimodal Generation and Editing: A Survey

Instruct-MusicGen: Unlocking Text-to-Music Editing for Music Language Models via Instruction Tuning

最近の投稿

最近のコメント

アーカイブ

カテゴリー