
S-HR-VQVAE: Sequential Hierarchical Residual Learning Vector Quantized Variational Autoencoder for Video Prediction

要約 我々は、(i) 新しい階層型残差学習ベクトル量子化変分オートエンコーダ ( … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, I.2.10 | コメントする

LightFFDNets: Lightweight Convolutional Neural Networks for Rapid Facial Forgery Detection

要約 偽造品を正確かつ迅速に認識することは、人工知能、画像処理、物体検出の分野に … 続きを読む

カテゴリー: cs.AI, cs.CV, I.2.10 | LightFFDNets: Lightweight Convolutional Neural Networks for Rapid Facial Forgery Detection はコメントを受け付けていません

VLEU: a Method for Automatic Evaluation for Generalizability of Text-to-Image Models

要約 Text-to-Image (T2I) モデルの進歩により、テキストの説明 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, I.2.10 | VLEU: a Method for Automatic Evaluation for Generalizability of Text-to-Image Models はコメントを受け付けていません

SAG-ViT: A Scale-Aware, High-Fidelity Patching Approach with Graph Attention for Vision Transformers

要約 画像分類は、モデルが画像を分析して特定のラベルに分類するコンピューター ビ … 続きを読む

カテゴリー: 68T07, cs.AI, cs.CV, cs.LG, I.2.10 | SAG-ViT: A Scale-Aware, High-Fidelity Patching Approach with Graph Attention for Vision Transformers はコメントを受け付けていません

LLaMA-Mesh: Unifying 3D Mesh Generation with Language Models

要約 この研究では、テキストで事前トレーニングされた大規模言語モデル (LLM) … 続きを読む

カテゴリー: 68T05, cs.AI, cs.CL, cs.CV, cs.LG, I.2.10 | LLaMA-Mesh: Unifying 3D Mesh Generation with Language Models はコメントを受け付けていません

Leonardo vindicated: Pythagorean trees for minimal reconstruction of the natural branching structures

要約 樹木は、その自然の美しさ、そしていくつかの独立した基準に関して最適なエンジ … 続きを読む

カテゴリー: 28A80, 68T45, 68U05, 92C80, cs.AI, cs.LG, I.2.10 | Leonardo vindicated: Pythagorean trees for minimal reconstruction of the natural branching structures はコメントを受け付けていません

Diverse capability and scaling of diffusion and auto-regressive models when learning abstract rules

要約 人間は、限られたサンプルから規則的な構造を発見し、推測したルールを新しい設 … 続きを読む

カテゴリー: 62H30, 68T07, 68T09, 68T20, cs.AI, cs.CV, cs.LG, cs.NE, I.2.10 | Diverse capability and scaling of diffusion and auto-regressive models when learning abstract rules はコメントを受け付けていません

Multimodal Structure-Aware Quantum Data Processing

要約 大規模言語モデル (LLM) は自然言語処理 (NLP) の分野を進歩させ … 続きを読む

カテゴリー: 68Q12, 68T45, 68T50, 68U10, 68U15, 81P45, 81P68, cs.LG, I.2.10 | Multimodal Structure-Aware Quantum Data Processing はコメントを受け付けていません

Multimodal Structure-Aware Quantum Data Processing

要約 大規模言語モデル (LLM) は自然言語処理 (NLP) の分野を進歩させ … 続きを読む

カテゴリー: 68Q12, 68T45, 68T50, 68U10, 68U15, 81P45, 81P68, cs.LG, I.2.10 | Multimodal Structure-Aware Quantum Data Processing はコメントを受け付けていません

A Nerf-Based Color Consistency Method for Remote Sensing Images

要約 季節、照明、大気条件の違いにより、取得された画像の測光は大きく変化し、モザ … 続きを読む

カテゴリー: 68T07, cs.AI, cs.CV, I.2.10 | A Nerf-Based Color Consistency Method for Remote Sensing Images はコメントを受け付けていません