-
最近の投稿
- Exploring Diffusion Transformer Designs via Grafting
- Kinetics: Rethinking Test-Time Scaling Laws
- Teaming in the AI Era: AI-Augmented Frameworks for Forming, Simulating, and Optimizing Human Teams
- Defurnishing with X-Ray Vision: Joint Removal of Furniture from Panoramas and Mesh
- Does It Make Sense to Speak of Introspection in Large Language Models?
-
最近のコメント
表示できるコメントはありません。 cs.AI (39264) cs.CL (29719) cs.CV (44650) cs.HC (2990) cs.LG (44175) cs.RO (23445) cs.SY (3577) eess.IV (5131) eess.SY (3569) stat.ML (5744)
「I.2.10」カテゴリーアーカイブ
Bayesian Data Augmentation and Training for Perception DNN in Autonomous Aerial Vehicles
要約 学習ベースのソリューションにより、自律システムの驚異的な機能が可能になりま … 続きを読む
Leveraging Bi-Focal Perspectives and Granular Feature Integration for Accurate Reliable Early Alzheimer’s Detection
要約 アルツハイマー病(AD)は最も一般的な神経変性であり、毎年何百万人もの患者 … 続きを読む
Birth and Death of a Rose
要約 私たちは、事前にトレーニングされた 2D 基礎モデルから、時間的なオブジェ … 続きを読む
Thermal and RGB Images Work Better Together in Wind Turbine Damage Detection
要約 風力タービンブレード (WTB) の検査は、構造の完全性と運用効率を確保す … 続きを読む
GeoPos: A Minimal Positional Encoding for Enhanced Fine-Grained Details in Image Synthesis Using Convolutional Neural Networks
要約 人間の手や指に存在するような複雑な幾何学的特徴を画像生成モデルが再現できな … 続きを読む
Comparative Analysis of Resource-Efficient CNN Architectures for Brain Tumor Classification
要約 MRI画像における正確な脳腫瘍の分類は、タイムリーな診断と治療計画のために … 続きを読む
S-HR-VQVAE: Sequential Hierarchical Residual Learning Vector Quantized Variational Autoencoder for Video Prediction
要約 我々は、(i) 新しい階層型残差学習ベクトル量子化変分オートエンコーダ ( … 続きを読む
LightFFDNets: Lightweight Convolutional Neural Networks for Rapid Facial Forgery Detection
要約 偽造品を正確かつ迅速に認識することは、人工知能、画像処理、物体検出の分野に … 続きを読む
VLEU: a Method for Automatic Evaluation for Generalizability of Text-to-Image Models
要約 Text-to-Image (T2I) モデルの進歩により、テキストの説明 … 続きを読む
SAG-ViT: A Scale-Aware, High-Fidelity Patching Approach with Graph Attention for Vision Transformers
要約 画像分類は、モデルが画像を分析して特定のラベルに分類するコンピューター ビ … 続きを読む