cs.LG」カテゴリーアーカイブ

Sim-and-Real Co-Training: A Simple Recipe for Vision-Based Robotic Manipulation

要約 大規模な現実世界のロボットデータセットは、ジェネラリストのロボットモデルを … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Sim-and-Real Co-Training: A Simple Recipe for Vision-Based Robotic Manipulation はコメントを受け付けていません

Which LIME should I trust? Concepts, Challenges, and Solutions

要約 ニューラルネットワークが必須システムで支配的になるにつれて、説明可能な人工 … 続きを読む

カテゴリー: cs.AI, cs.LG | Which LIME should I trust? Concepts, Challenges, and Solutions はコメントを受け付けていません

Effectively Controlling Reasoning Models through Thinking Intervention

要約 推論強化された大手言語モデル(LLMS)は、最終回答を生成する前に中間推論 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Effectively Controlling Reasoning Models through Thinking Intervention はコメントを受け付けていません

RIG: Synergizing Reasoning and Imagination in End-to-End Generalist Policy

要約 アクションの前に推論し、潜在的な結果(つまり、世界モデル)を想像することは … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | RIG: Synergizing Reasoning and Imagination in End-to-End Generalist Policy はコメントを受け付けていません

From Colors to Classes: Emergence of Concepts in Vision Transformers

要約 ビジョントランス(VITS)は、強力な表現能力により、さまざまなコンピュー … 続きを読む

カテゴリー: cs.CV, cs.LG | From Colors to Classes: Emergence of Concepts in Vision Transformers はコメントを受け付けていません

IMPACT: A Generic Semantic Loss for Multimodal Medical Image Registration

要約 画像登録は医療イメージングの基本であり、診断、治療計画、画像誘導治療、また … 続きを読む

カテゴリー: cs.CV, cs.LG | IMPACT: A Generic Semantic Loss for Multimodal Medical Image Registration はコメントを受け付けていません

It’s a (Blind) Match! Towards Vision-Language Correspondence without Parallel Data

要約 プラトニック表現仮説は、モデルとデータセットのサイズが増加するにつれて、ビ … 続きを読む

カテゴリー: cs.CV, cs.LG | It’s a (Blind) Match! Towards Vision-Language Correspondence without Parallel Data はコメントを受け付けていません

DICE: Discrete Inversion Enabling Controllable Editing for Multinomial Diffusion and Masked Generative Models

要約 離散拡散モデルは、画像生成やマスクされた言語モデリングなどのタスクで成功を … 続きを読む

カテゴリー: cs.CV, cs.LG | DICE: Discrete Inversion Enabling Controllable Editing for Multinomial Diffusion and Masked Generative Models はコメントを受け付けていません

MB-ORES: A Multi-Branch Object Reasoner for Visual Grounding in Remote Sensing

要約 リモートセンシング(RS)画像のオブジェクト検出(OD)と視覚的接地(VG … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | MB-ORES: A Multi-Branch Object Reasoner for Visual Grounding in Remote Sensing はコメントを受け付けていません

The impact of internal variability on benchmarking deep learning climate emulators

要約 完全複雑さのアースシステムモデル(ESM)は計算的に非常に高価であり、複数 … 続きを読む

カテゴリー: cs.AI, cs.CE, cs.CV, cs.LG | The impact of internal variability on benchmarking deep learning climate emulators はコメントを受け付けていません