cs.CV」カテゴリーアーカイブ

Small data deep learning methodology for in-field disease detection

要約 作物の病気を早期に検出することは、収穫量の損失を防ぎ、最終製品の品質を向上 … 続きを読む

カテゴリー: cs.CV | コメントする

Classification of Gleason Grading in Prostate Cancer Histopathology Images Using Deep Learning Techniques: YOLO, Vision Transformers, and Vision Mamba

要約 前立腺がんは男性に影響を与える主要な健康問題の一つにランクされており、グリ … 続きを読む

カテゴリー: cs.CV, eess.IV | コメントする

Streaming Neural Images

要約 Implicit Neural Representations (INR) … 続きを読む

カテゴリー: cs.CV, eess.IV | コメントする

Simple Image Signal Processing using Global Context Guidance

要約 最新のスマートフォン カメラでは、イメージ シグナル プロセッサ (ISP … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | コメントする

PACE: marrying generalization in PArameter-efficient fine-tuning with Consistency rEgularization

要約 Parameter-Efficient Fine-Tuning (PEFT … 続きを読む

カテゴリー: cs.CV, cs.LG | コメントする

Pre-trained Language Models Do Not Help Auto-regressive Text-to-Image Generation

要約 VQ-VAE などの画像トークナイザーの最近の進歩により、言語モデリングと … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントする

Attention Prompting on Image for Large Vision-Language Models

要約 大規模言語モデル (LLM) と比較して、大規模視覚言語モデル (LVLM … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

DreamWaltz-G: Expressive 3D Gaussian Avatars from Skeleton-Guided 2D Diffusion

要約 事前トレーニングされた 2D 拡散モデルとスコア蒸留サンプリング (SDS … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.LG | コメントする

Molmo and PixMo: Open Weights and Open Data for State-of-the-Art Multimodal Models

要約 現在の最も先進的なマルチモーダル モデルは独自の仕様のままです。 最強のオ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | コメントする

Efficient Motion Prediction: A Lightweight & Accurate Trajectory Prediction Model With Fast Training and Inference Speed

要約 効率的かつ安全な自動運転のためには、自動運転車両が他の交通エージェントの動 … 続きを読む

カテゴリー: cs.CV, cs.RO | コメントする