「cs.LG」カテゴリーアーカイブ

PatchDEMUX: A Certifiably Robust Framework for Multi-label Classifiers Against Adversarial Patches

投稿日: 2025年6月2日作成者: jarxiv

要約ディープラーニング技術により、コンピュータービジョンテクノロジーの大幅な改 … 続きを読む →

カテゴリー: cs.CR, cs.CV, cs.LG | コメントを受け付けていません

Post-hoc Probabilistic Vision-Language Models

投稿日: 2025年6月2日作成者: jarxiv

要約クリップやSiglipなどのビジョン言語モデル（VLM）は、分類、検索、お … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Efficient Estimation of Regularized Tyler’s M-Estimator Using Approximate LOOCV

投稿日: 2025年6月2日作成者: jarxiv

要約正則化係数$ \ alpha \ in（0,1）$を正規化する係数$ \ … 続きを読む →

カテゴリー: cs.CE, cs.CV, cs.LG, eess.SP, I.2.0, stat.ML | コメントを受け付けていません

Deep Augmentation: Dropout as Augmentation for Self-Supervised Learning

投稿日: 2025年6月2日作成者: jarxiv

要約ドロップアウトの機械学習における普及にもかかわらず、データ増強の形態として … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG | コメントを受け付けていません

U2-BENCH: Benchmarking Large Vision-Language Models on Ultrasound Understanding

投稿日: 2025年6月2日作成者: jarxiv

要約超音波は、グローバルなヘルスケアにとって重要なイメージングモダリティですが … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Bi-Manual Joint Camera Calibration and Scene Representation

投稿日: 2025年6月2日作成者: jarxiv

要約ロボット操作、特に両操作では、複数のロボットマニピュレーターに複数のカメラ … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Using Knowledge Graphs to harvest datasets for efficient CLIP model training

投稿日: 2025年6月2日作成者: jarxiv

要約高品質のクリップモデルのトレーニングには、通常、膨大なデータセットが必要で … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.IR, cs.LG | コメントを受け付けていません

Vision LLMs Are Bad at Hierarchical Visual Understanding, and LLMs Are the Bottleneck

投稿日: 2025年6月2日作成者: jarxiv

要約このペーパーでは、最先端の大規模な言語モデル（LLM）が私たちの視覚的世界 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Reading Recognition in the Wild

投稿日: 2025年6月2日作成者: jarxiv

要約常にオンのスマートメガネでエゴセントリックコンテキストAIを有効にするには … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

MoDoMoDo: Multi-Domain Data Mixtures for Multimodal LLM Reinforcement Learning

投稿日: 2025年6月2日作成者: jarxiv

要約検証可能な報酬（RLVR）による強化学習は、最近、トレーニング後の大手言語 … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

PatchDEMUX: A Certifiably Robust Framework for Multi-label Classifiers Against Adversarial Patches

Post-hoc Probabilistic Vision-Language Models

Efficient Estimation of Regularized Tyler’s M-Estimator Using Approximate LOOCV

Deep Augmentation: Dropout as Augmentation for Self-Supervised Learning

U2-BENCH: Benchmarking Large Vision-Language Models on Ultrasound Understanding

Bi-Manual Joint Camera Calibration and Scene Representation

Using Knowledge Graphs to harvest datasets for efficient CLIP model training

Vision LLMs Are Bad at Hierarchical Visual Understanding, and LLMs Are the Bottleneck

Reading Recognition in the Wild

MoDoMoDo: Multi-Domain Data Mixtures for Multimodal LLM Reinforcement Learning

最近の投稿

最近のコメント

アーカイブ

カテゴリー