cs.AI」カテゴリーアーカイブ

CLIP with Generative Latent Replay: a Strong Baseline for Incremental Learning

要約 トランスフォーマーや CLIP などのビジョン言語モデル (VLM) の出 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | CLIP with Generative Latent Replay: a Strong Baseline for Incremental Learning はコメントを受け付けていません

Learning Multi-modal Representations by Watching Hundreds of Surgical Video Lectures

要約 外科用コンピュータ ビジョンの最近の進歩は、言語セマンティクスを欠いた視覚 … 続きを読む

カテゴリー: cs.AI, cs.CV | Learning Multi-modal Representations by Watching Hundreds of Surgical Video Lectures はコメントを受け付けていません

Stretching Each Dollar: Diffusion Training from Scratch on a Micro-Budget

要約 生成 AI のスケーリングの法則がパフォーマンスを高めると同時に、大量の計 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Stretching Each Dollar: Diffusion Training from Scratch on a Micro-Budget はコメントを受け付けていません

Learning to Manipulate Anywhere: A Visual Generalizable Framework For Reinforcement Learning

要約 視覚運動ロボットに、オープンワールドの多様なシナリオで動作する汎用化機能を … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Learning to Manipulate Anywhere: A Visual Generalizable Framework For Reinforcement Learning はコメントを受け付けていません

Detecting Brittle Decisions for Free: Leveraging Margin Consistency in Deep Robust Classifiers

要約 堅牢性を向上させるための敵対的トレーニング戦略に関する広範な研究にもかかわ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Detecting Brittle Decisions for Free: Leveraging Margin Consistency in Deep Robust Classifiers はコメントを受け付けていません

Towards Latent Masked Image Modeling for Self-Supervised Visual Representation Learning

要約 マスク イメージ モデリング (MIM) は、画像のマスクされた部分から欠 … 続きを読む

カテゴリー: cs.AI, cs.CV | Towards Latent Masked Image Modeling for Self-Supervised Visual Representation Learning はコメントを受け付けていません

HandDGP: Camera-Space Hand Mesh Prediction with Differentiable Global Positioning

要約 単一の RGB 画像からカメラ空間のハンド メッシュを予測することは、3D … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | HandDGP: Camera-Space Hand Mesh Prediction with Differentiable Global Positioning はコメントを受け付けていません

CarFormer: Self-Driving with Learned Object-Centric Representations

要約 自動運転では表現の選択が重要な役割を果たします。 近年、Bird&#821 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | CarFormer: Self-Driving with Learned Object-Centric Representations はコメントを受け付けていません

Reconstructing Training Data From Real World Models Trained with Transfer Learning

要約 トレーニングされた分類器からトレーニング データを再構成する現在の方法は、 … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.CV, cs.LG | Reconstructing Training Data From Real World Models Trained with Transfer Learning はコメントを受け付けていません

RoboGolf: Mastering Real-World Minigolf with a Reflective Multi-Modality Vision-Language Model

要約 ミニゴルフは、身体化された知性を調べるための模範的な現実世界のゲームであり … 続きを読む

カテゴリー: cs.AI, cs.RO | RoboGolf: Mastering Real-World Minigolf with a Reflective Multi-Modality Vision-Language Model はコメントを受け付けていません