-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「I.2.10」カテゴリーアーカイブ
Thermal and RGB Images Work Better Together in Wind Turbine Damage Detection
要約 風力タービンブレード (WTB) の検査は、構造の完全性と運用効率を確保す … 続きを読む
GeoPos: A Minimal Positional Encoding for Enhanced Fine-Grained Details in Image Synthesis Using Convolutional Neural Networks
要約 人間の手や指に存在するような複雑な幾何学的特徴を画像生成モデルが再現できな … 続きを読む
Comparative Analysis of Resource-Efficient CNN Architectures for Brain Tumor Classification
要約 MRI画像における正確な脳腫瘍の分類は、タイムリーな診断と治療計画のために … 続きを読む
S-HR-VQVAE: Sequential Hierarchical Residual Learning Vector Quantized Variational Autoencoder for Video Prediction
要約 我々は、(i) 新しい階層型残差学習ベクトル量子化変分オートエンコーダ ( … 続きを読む
LightFFDNets: Lightweight Convolutional Neural Networks for Rapid Facial Forgery Detection
要約 偽造品を正確かつ迅速に認識することは、人工知能、画像処理、物体検出の分野に … 続きを読む
VLEU: a Method for Automatic Evaluation for Generalizability of Text-to-Image Models
要約 Text-to-Image (T2I) モデルの進歩により、テキストの説明 … 続きを読む
SAG-ViT: A Scale-Aware, High-Fidelity Patching Approach with Graph Attention for Vision Transformers
要約 画像分類は、モデルが画像を分析して特定のラベルに分類するコンピューター ビ … 続きを読む
LLaMA-Mesh: Unifying 3D Mesh Generation with Language Models
要約 この研究では、テキストで事前トレーニングされた大規模言語モデル (LLM) … 続きを読む
Leonardo vindicated: Pythagorean trees for minimal reconstruction of the natural branching structures
要約 樹木は、その自然の美しさ、そしていくつかの独立した基準に関して最適なエンジ … 続きを読む
Diverse capability and scaling of diffusion and auto-regressive models when learning abstract rules
要約 人間は、限られたサンプルから規則的な構造を発見し、推測したルールを新しい設 … 続きを読む