-
最近の投稿
- Multimodal Machine Learning Can Predict Videoconference Fluidity and Enjoyment
- Scaling Efficient LLMs
- Piano Transcription by Hierarchical Language Modeling with Pretrained Roll-based Encoders
- Lived Experience Not Found: LLMs Struggle to Align with Experts on Addressing Adverse Drug Reactions from Psychiatric Medication Use
- Samba-ASR: State-Of-The-Art Speech Recognition Leveraging Structured State-Space Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (31841) cs.CL (24084) cs.CR (2470) cs.CV (38127) cs.LG (36713) cs.RO (18601) cs.SY (2850) eess.IV (4579) eess.SY (2844) stat.ML (4859)
「I.2.10」カテゴリーアーカイブ
LightFFDNets: Lightweight Convolutional Neural Networks for Rapid Facial Forgery Detection
要約 偽造品を正確かつ迅速に認識することは、人工知能、画像処理、物体検出の分野に … 続きを読む
VLEU: a Method for Automatic Evaluation for Generalizability of Text-to-Image Models
要約 Text-to-Image (T2I) モデルの進歩により、テキストの説明 … 続きを読む
SAG-ViT: A Scale-Aware, High-Fidelity Patching Approach with Graph Attention for Vision Transformers
要約 画像分類は、モデルが画像を分析して特定のラベルに分類するコンピューター ビ … 続きを読む
LLaMA-Mesh: Unifying 3D Mesh Generation with Language Models
要約 この研究では、テキストで事前トレーニングされた大規模言語モデル (LLM) … 続きを読む
Leonardo vindicated: Pythagorean trees for minimal reconstruction of the natural branching structures
要約 樹木は、その自然の美しさ、そしていくつかの独立した基準に関して最適なエンジ … 続きを読む
Diverse capability and scaling of diffusion and auto-regressive models when learning abstract rules
要約 人間は、限られたサンプルから規則的な構造を発見し、推測したルールを新しい設 … 続きを読む
Multimodal Structure-Aware Quantum Data Processing
要約 大規模言語モデル (LLM) は自然言語処理 (NLP) の分野を進歩させ … 続きを読む
Multimodal Structure-Aware Quantum Data Processing
要約 大規模言語モデル (LLM) は自然言語処理 (NLP) の分野を進歩させ … 続きを読む
A Nerf-Based Color Consistency Method for Remote Sensing Images
要約 季節、照明、大気条件の違いにより、取得された画像の測光は大きく変化し、モザ … 続きを読む
Leveraging Bi-Focal Perspectives and Granular Feature Integration for Accurate Reliable Early Alzheimer’s Detection
要約 アルツハイマー病 (AD) は神経変性の最も一般的な形態であり、毎年何百万 … 続きを読む