cs.LG」カテゴリーアーカイブ

Delving into RL for Image Generation with CoT: A Study on DPO vs. GRPO

要約 最近の進歩は、大規模な言語モデル(LLM)の考え方(COT)の推論能力を高 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントする

StreamSplat: Towards Online Dynamic 3D Reconstruction from Uncalibrated Video Streams

要約 非調整されたビデオストリームからの動的3Dシーンのリアルタイム再構成は、多 … 続きを読む

カテゴリー: cs.CV, cs.LG | コメントする

k-NN as a Simple and Effective Estimator of Transferability

要約 ドメインがシフトされ、タスクが異なり、アーキテクチャが変化する新しい設定で … 続きを読む

カテゴリー: cs.CV, cs.LG | コメントする

Multimodal Unsupervised Domain Generalization by Retrieving Across the Modality Gap

要約 ドメイン一般化(DG)は、共有ラベルスペースの仮定の下で、1つ以上のソース … 続きを読む

カテゴリー: cs.CV, cs.LG | コメントする

Segment Concealed Objects with Incomplete Supervision

要約 不完全に監視されている隠されたオブジェクトセグメンテーション(ISCOS) … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | コメントする

Data Augmentation For Small Object using Fast AutoAugment

要約 近年、オブジェクト検出パフォーマンスには大きな進歩があります。 ただし、こ … 続きを読む

カテゴリー: cs.CV, cs.LG | コメントする

Efficient Medical Vision-Language Alignment Through Adapting Masked Vision Models

要約 クロスモーダルコントラスト学習を通じて、医療視覚言語の整合により、検索やゼ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | コメントする

DIsoN: Decentralized Isolation Networks for Out-of-Distribution Detection in Medical Imaging

要約 医療イメージングなどの安全性が批判的なドメインにおける機械学習(ML)モデ … 続きを読む

カテゴリー: cs.CV, cs.LG, I.2.0 | コメントする

Diffuse and Disperse: Image Generation with Representation Regularization

要約 過去10年間の拡散ベースの生成モデルの開発は、表現学習の進歩とは独立して主 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | コメントする

Thinking vs. Doing: Agents that Reason by Scaling Test-Time Interaction

要約 テスト時間スケーリングの現在のパラダイムは、応答を生成する前に、長い推論ト … 続きを読む

カテゴリー: cs.AI, cs.LG | コメントする