cs.AI」カテゴリーアーカイブ

CaLa: Complementary Association Learning for Augmenting Composed Image Retrieval

要約 合成画像検索 (CIR) には、画像とテキストのペアのクエリに基づいてター … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.IR | CaLa: Complementary Association Learning for Augmenting Composed Image Retrieval はコメントを受け付けていません

Going beyond compositional generalization, DDPMs can produce zero-shot interpolation

要約 ノイズ除去拡散確率モデル (DDPM) は画像生成において顕著な機能を示し … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.NE | Going beyond compositional generalization, DDPMs can produce zero-shot interpolation はコメントを受け付けていません

VideoTree: Adaptive Tree-based Video Representation for LLM Reasoning on Long Videos

要約 ビデオ言語を理解するタスクは短いビデオ クリップに焦点を当てており、多くの … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | VideoTree: Adaptive Tree-based Video Representation for LLM Reasoning on Long Videos はコメントを受け付けていません

Intelligent Anomaly Detection for Lane Rendering Using Transformer with Self-Supervised Pre-Training and Customized Fine-Tuning

要約 デジタル地図を使用したナビゲーション サービスの急増は、ドライバーに大きな … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, eess.IV, stat.ML | Intelligent Anomaly Detection for Lane Rendering Using Transformer with Self-Supervised Pre-Training and Customized Fine-Tuning はコメントを受け付けていません

Track Anything Rapter(TAR)

要約 オブジェクト追跡は、交通監視、ロボティクス、自動車両追跡など、さまざまな領 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Track Anything Rapter(TAR) はコメントを受け付けていません

ConceptPrune: Concept Editing in Diffusion Models via Skilled Neuron Pruning

要約 大規模なテキストから画像への拡散モデルは、優れた画像生成機能を実証していま … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | ConceptPrune: Concept Editing in Diffusion Models via Skilled Neuron Pruning はコメントを受け付けていません

Neural Isometries: Taming Transformations for Equivariant ML

要約 現実世界のジオメトリと 3D ビジョンのタスクには、扱いやすい分析表現を妨 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG | Neural Isometries: Taming Transformations for Equivariant ML はコメントを受け付けていません

NPGA: Neural Parametric Gaussian Avatars

要約 人間の頭の高忠実度のデジタル バージョンの作成は、仮想コンポーネントを私た … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR | NPGA: Neural Parametric Gaussian Avatars はコメントを受け付けていません

LLMs Meet Multimodal Generation and Editing: A Survey

要約 大規模言語モデル (LLM) の最近の進歩により、LLM とマルチモーダル … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | LLMs Meet Multimodal Generation and Editing: A Survey はコメントを受け付けていません

Instruct-MusicGen: Unlocking Text-to-Music Editing for Music Language Models via Instruction Tuning

要約 テキストから音楽への編集における最近の進歩は、テキスト クエリを使用して音 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.MM, cs.SD, eess.AS | Instruct-MusicGen: Unlocking Text-to-Music Editing for Music Language Models via Instruction Tuning はコメントを受け付けていません