cs.CV」カテゴリーアーカイブ

Post-hoc Probabilistic Vision-Language Models

要約 クリップやSiglipなどのビジョン言語モデル(VLM)は、分類、検索、お … 続きを読む

カテゴリー: cs.CV, cs.LG | Post-hoc Probabilistic Vision-Language Models はコメントを受け付けていません

Disentangled Source-Free Personalization for Facial Expression Recognition with Neutral Target Data

要約 ビデオからの表情表現認識(FER)は、ヒューマンコンピューターの相互作用や … 続きを読む

カテゴリー: cs.CV | Disentangled Source-Free Personalization for Facial Expression Recognition with Neutral Target Data はコメントを受け付けていません

Efficient Estimation of Regularized Tyler’s M-Estimator Using Approximate LOOCV

要約 正則化係数$ \ alpha \ in(0,1)$を正規化する係数$ \ … 続きを読む

カテゴリー: cs.CE, cs.CV, cs.LG, eess.SP, I.2.0, stat.ML | Efficient Estimation of Regularized Tyler’s M-Estimator Using Approximate LOOCV はコメントを受け付けていません

Progressive Prompt Detailing for Improved Alignment in Text-to-Image Generative Models

要約 テキストからイメージへの生成モデルは、しばしば複雑なシーン、明確な視覚的特 … 続きを読む

カテゴリー: cs.AI, cs.CV | Progressive Prompt Detailing for Improved Alignment in Text-to-Image Generative Models はコメントを受け付けていません

DiG-Net: Enhancing Quality of Life through Hyper-Range Dynamic Gesture Recognition in Assistive Robotics

要約 ダイナミックハンドジェスチャーは、特にモビリティの制約を備えた個人や操作ロ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | DiG-Net: Enhancing Quality of Life through Hyper-Range Dynamic Gesture Recognition in Assistive Robotics はコメントを受け付けていません

Draw ALL Your Imagine: A Holistic Benchmark and Agent Framework for Complex Instruction-based Image Generation

要約 テキストからイメージ(T2I)生成の最近の進歩により、モデルはテキストの説 … 続きを読む

カテゴリー: cs.CL, cs.CV | Draw ALL Your Imagine: A Holistic Benchmark and Agent Framework for Complex Instruction-based Image Generation はコメントを受け付けていません

Lightweight Relational Embedding in Task-Interpolated Few-Shot Networks for Enhanced Gastrointestinal Disease Classification

要約 大腸内視鏡検査のような従来の診断方法は、結腸直腸癌(CRC)の正確な診断に … 続きを読む

カテゴリー: cs.CV | Lightweight Relational Embedding in Task-Interpolated Few-Shot Networks for Enhanced Gastrointestinal Disease Classification はコメントを受け付けていません

TC-GS: A Faster Gaussian Splatting Module Utilizing Tensor Cores

要約 3Dガウススプラッティング(3DG)は、ガウスブレンドがレンダリングパイプ … 続きを読む

カテゴリー: cs.CV, cs.DC, cs.GR, D.1.3 | TC-GS: A Faster Gaussian Splatting Module Utilizing Tensor Cores はコメントを受け付けていません

Deep Augmentation: Dropout as Augmentation for Self-Supervised Learning

要約 ドロップアウトの機械学習における普及にもかかわらず、データ増強の形態として … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | Deep Augmentation: Dropout as Augmentation for Self-Supervised Learning はコメントを受け付けていません

U2-BENCH: Benchmarking Large Vision-Language Models on Ultrasound Understanding

要約 超音波は、グローバルなヘルスケアにとって重要なイメージングモダリティですが … 続きを読む

カテゴリー: cs.CV, cs.LG | U2-BENCH: Benchmarking Large Vision-Language Models on Ultrasound Understanding はコメントを受け付けていません