cs.LG」カテゴリーアーカイブ

Multimodal Unsupervised Domain Generalization by Retrieving Across the Modality Gap

要約 ドメイン一般化(DG)は、共有ラベルスペースの仮定の下で、1つ以上のソース … 続きを読む

カテゴリー: cs.CV, cs.LG | Multimodal Unsupervised Domain Generalization by Retrieving Across the Modality Gap はコメントを受け付けていません

Segment Concealed Objects with Incomplete Supervision

要約 不完全に監視されている隠されたオブジェクトセグメンテーション(ISCOS) … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Segment Concealed Objects with Incomplete Supervision はコメントを受け付けていません

Data Augmentation For Small Object using Fast AutoAugment

要約 近年、オブジェクト検出パフォーマンスには大きな進歩があります。 ただし、こ … 続きを読む

カテゴリー: cs.CV, cs.LG | Data Augmentation For Small Object using Fast AutoAugment はコメントを受け付けていません

Efficient Medical Vision-Language Alignment Through Adapting Masked Vision Models

要約 クロスモーダルコントラスト学習を通じて、医療視覚言語の整合により、検索やゼ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Efficient Medical Vision-Language Alignment Through Adapting Masked Vision Models はコメントを受け付けていません

DIsoN: Decentralized Isolation Networks for Out-of-Distribution Detection in Medical Imaging

要約 医療イメージングなどの安全性が批判的なドメインにおける機械学習(ML)モデ … 続きを読む

カテゴリー: cs.CV, cs.LG, I.2.0 | DIsoN: Decentralized Isolation Networks for Out-of-Distribution Detection in Medical Imaging はコメントを受け付けていません

Diffuse and Disperse: Image Generation with Representation Regularization

要約 過去10年間の拡散ベースの生成モデルの開発は、表現学習の進歩とは独立して主 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Diffuse and Disperse: Image Generation with Representation Regularization はコメントを受け付けていません

Thinking vs. Doing: Agents that Reason by Scaling Test-Time Interaction

要約 テスト時間スケーリングの現在のパラダイムは、応答を生成する前に、長い推論ト … 続きを読む

カテゴリー: cs.AI, cs.LG | Thinking vs. Doing: Agents that Reason by Scaling Test-Time Interaction はコメントを受け付けていません

From Pixels to Predicates: Learning Symbolic World Models via Pretrained Vision-Language Models

要約 私たちの目的は、低レベルのスキルと、一連の画像を含む少数の短距離デモンスト … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | From Pixels to Predicates: Learning Symbolic World Models via Pretrained Vision-Language Models はコメントを受け付けていません

Towards Autonomous Reinforcement Learning for Real-World Robotic Manipulation with Large Language Models

要約 大規模な言語モデル(LLMS)および視覚言語モデル(VLM)の最近の進歩は … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Towards Autonomous Reinforcement Learning for Real-World Robotic Manipulation with Large Language Models はコメントを受け付けていません

Imperative Learning: A Self-supervised Neuro-Symbolic Learning Framework for Robot Autonomy

要約 強化や模倣学習などのデータ駆動型の方法は、ロボットの自律性において顕著な成 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Imperative Learning: A Self-supervised Neuro-Symbolic Learning Framework for Robot Autonomy はコメントを受け付けていません