cs.AI」カテゴリーアーカイブ

VEGGIE: Instructional Editing and Reasoning Video Concepts with Grounded Generation

要約 最近のビデオ拡散モデルはビデオ編集を強化していますが、統一されたフレームワ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | VEGGIE: Instructional Editing and Reasoning Video Concepts with Grounded Generation はコメントを受け付けていません

Retrospective: A CORDIC Based Configurable Activation Function for NN Applications

要約 機能的な再構成性を提供することにより、リソース制約システムのASICハード … 続きを読む

カテゴリー: cs.AI, cs.AR, cs.CV, cs.ET, eess.IV | Retrospective: A CORDIC Based Configurable Activation Function for NN Applications はコメントを受け付けていません

The Shape of Attraction in UMAP: Exploring the Embedding Forces in Dimensionality Reduction

要約 均一なマニホールド近似と投影(UMAP)は、最も人気のあるネイバーの埋め込 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | The Shape of Attraction in UMAP: Exploring the Embedding Forces in Dimensionality Reduction はコメントを受け付けていません

PQPP: A Joint Benchmark for Text-to-Image Prompt and Query Performance Prediction

要約 テキストからイメージの生成は最近、生成的拡散モデルの視覚的に印象的な結果に … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | PQPP: A Joint Benchmark for Text-to-Image Prompt and Query Performance Prediction はコメントを受け付けていません

PULASki: Learning inter-rater variability using statistical distances to improve probabilistic segmentation

要約 医療イメージングの領域では、セグメンテーションのための多くの監視された学習 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.HC, cs.LG | PULASki: Learning inter-rater variability using statistical distances to improve probabilistic segmentation はコメントを受け付けていません

ExDDV: A New Dataset for Explainable Deepfake Detection in Video

要約 生成されたビデオのリアリズムと品質が増え続けると、自動ディープフェイク検出 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | ExDDV: A New Dataset for Explainable Deepfake Detection in Video はコメントを受け付けていません

Cosmos World Foundation Model Platform for Physical AI

要約 物理的なAIは、最初にデジタルで訓練する必要があります。 それ自体のデジタ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Cosmos World Foundation Model Platform for Physical AI はコメントを受け付けていません

MagicComp: Training-free Dual-Phase Refinement for Compositional Video Generation

要約 テキストツービデオ(T2V)の生成は、拡散モデルで大きな進歩を遂げました。 … 続きを読む

カテゴリー: cs.AI, cs.CV | MagicComp: Training-free Dual-Phase Refinement for Compositional Video Generation はコメントを受け付けていません

Text-to-3D Generation using Jensen-Shannon Score Distillation

要約 スコア蒸留サンプリングは、テキストプロンプトから3Dモデルを生成するための … 続きを読む

カテゴリー: cs.AI, cs.CV | Text-to-3D Generation using Jensen-Shannon Score Distillation はコメントを受け付けていません

DiffMoE: Dynamic Token Selection for Scalable Diffusion Transformers

要約 拡散モデルは、さまざまな画像生成タスクで顕著な成功を示していますが、さまざ … 続きを読む

カテゴリー: cs.AI, cs.CV | DiffMoE: Dynamic Token Selection for Scalable Diffusion Transformers はコメントを受け付けていません