「cs.CV」カテゴリーアーカイブ

Post-hoc Probabilistic Vision-Language Models

投稿日: 2025年6月2日作成者: jarxiv

要約クリップやSiglipなどのビジョン言語モデル（VLM）は、分類、検索、お … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Disentangled Source-Free Personalization for Facial Expression Recognition with Neutral Target Data

投稿日: 2025年6月2日作成者: jarxiv

要約ビデオからの表情表現認識（FER）は、ヒューマンコンピューターの相互作用や … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Efficient Estimation of Regularized Tyler’s M-Estimator Using Approximate LOOCV

投稿日: 2025年6月2日作成者: jarxiv

要約正則化係数$ \ alpha \ in（0,1）$を正規化する係数$ \ … 続きを読む →

カテゴリー: cs.CE, cs.CV, cs.LG, eess.SP, I.2.0, stat.ML | コメントを受け付けていません

Progressive Prompt Detailing for Improved Alignment in Text-to-Image Generative Models

投稿日: 2025年6月2日作成者: jarxiv

要約テキストからイメージへの生成モデルは、しばしば複雑なシーン、明確な視覚的特 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

DiG-Net: Enhancing Quality of Life through Hyper-Range Dynamic Gesture Recognition in Assistive Robotics

投稿日: 2025年6月2日作成者: jarxiv

要約ダイナミックハンドジェスチャーは、特にモビリティの制約を備えた個人や操作ロ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

Draw ALL Your Imagine: A Holistic Benchmark and Agent Framework for Complex Instruction-based Image Generation

投稿日: 2025年6月2日作成者: jarxiv

要約テキストからイメージ（T2I）生成の最近の進歩により、モデルはテキストの説 … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Lightweight Relational Embedding in Task-Interpolated Few-Shot Networks for Enhanced Gastrointestinal Disease Classification

投稿日: 2025年6月2日作成者: jarxiv

要約大腸内視鏡検査のような従来の診断方法は、結腸直腸癌（CRC）の正確な診断に … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

TC-GS: A Faster Gaussian Splatting Module Utilizing Tensor Cores

投稿日: 2025年6月2日作成者: jarxiv

要約 3Dガウススプラッティング（3DG）は、ガウスブレンドがレンダリングパイプ … 続きを読む →

カテゴリー: cs.CV, cs.DC, cs.GR, D.1.3 | コメントを受け付けていません

Deep Augmentation: Dropout as Augmentation for Self-Supervised Learning

投稿日: 2025年6月2日作成者: jarxiv

要約ドロップアウトの機械学習における普及にもかかわらず、データ増強の形態として … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG | コメントを受け付けていません

U2-BENCH: Benchmarking Large Vision-Language Models on Ultrasound Understanding

投稿日: 2025年6月2日作成者: jarxiv

要約超音波は、グローバルなヘルスケアにとって重要なイメージングモダリティですが … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Post-hoc Probabilistic Vision-Language Models

Disentangled Source-Free Personalization for Facial Expression Recognition with Neutral Target Data

Efficient Estimation of Regularized Tyler’s M-Estimator Using Approximate LOOCV

Progressive Prompt Detailing for Improved Alignment in Text-to-Image Generative Models

DiG-Net: Enhancing Quality of Life through Hyper-Range Dynamic Gesture Recognition in Assistive Robotics

Draw ALL Your Imagine: A Holistic Benchmark and Agent Framework for Complex Instruction-based Image Generation

Lightweight Relational Embedding in Task-Interpolated Few-Shot Networks for Enhanced Gastrointestinal Disease Classification

TC-GS: A Faster Gaussian Splatting Module Utilizing Tensor Cores

Deep Augmentation: Dropout as Augmentation for Self-Supervised Learning

U2-BENCH: Benchmarking Large Vision-Language Models on Ultrasound Understanding

最近の投稿

最近のコメント

アーカイブ

カテゴリー