「cs.AI」カテゴリーアーカイブ

LoRID: Low-Rank Iterative Diffusion for Adversarial Purification

投稿日: 2024年9月13日作成者: jarxiv

要約この研究は、拡散ベースの浄化方法、つまり拡散モデルを利用して敵対的な例にお … 続きを読む →

カテゴリー: cs.AI, cs.CR, cs.LG | コメントを受け付けていません

Derivative-Free Guidance in Continuous and Discrete Diffusion Models with Soft Value-Based Decoding

投稿日: 2024年9月13日作成者: jarxiv

要約拡散モデルは、画像、分子、DNA、RNA、タンパク質配列の自然な設計空間を … 続きを読む →

カテゴリー: cs.AI, cs.LG, q-bio.GN, stat.ML | コメントを受け付けていません

Windows Agent Arena: Evaluating Multi-Modal OS Agents at Scale

投稿日: 2024年9月13日作成者: jarxiv

要約大規模言語モデル (LLM) は、計画と推論を必要とするマルチモーダルなタ … 続きを読む →

カテゴリー: cs.AI | コメントを受け付けていません

AnySkin: Plug-and-play Skin Sensing for Robotic Touch

投稿日: 2024年9月13日作成者: jarxiv

要約触覚センシングは重要かつ有用なセンシングモダリティとして広く受け入れられて … 続きを読む →

カテゴリー: cs.AI, cs.RO | コメントを受け付けていません

NITRO-D: Native Integer-only Training of Deep Convolutional Neural Networks

投稿日: 2024年9月13日作成者: jarxiv

要約量子化は、ディープニューラルネットワーク (DNN) の着実に増加する … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.NE, I.2.6 | コメントを受け付けていません

Unified Domain Adaptive Semantic Segmentation

投稿日: 2024年9月13日作成者: jarxiv

要約監視なしドメイン適応型セマンティックセグメンテーション (UDA-SS) … 続きを読む →

カテゴリー: cs.AI, cs.CV, eess.IV | コメントを受け付けていません

Zero-Shot Whole Slide Image Retrieval in Histopathology Using Embeddings of Foundation Models

投稿日: 2024年9月13日作成者: jarxiv

要約私たちは、画像検索のために、最近公開された病理組織学用の基礎モデルをテスト … 続きを読む →

カテゴリー: cs.AI, cs.CV, eess.IV | コメントを受け付けていません

What Makes a Maze Look Like a Maze?

投稿日: 2024年9月13日作成者: jarxiv

要約人間の視覚的理解のユニークな側面は、抽象的な概念を柔軟に解釈する能力です。 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

LT3SD: Latent Trees for 3D Scene Diffusion

投稿日: 2024年9月13日作成者: jarxiv

要約我々は、大規模な 3D シーン生成のための新しい潜在拡散モデル LT3SD … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

IFAdapter: Instance Feature Control for Grounded Text-to-Image Generation

投稿日: 2024年9月13日作成者: jarxiv

要約 Text-to-Image (T2I) 拡散モデルは、個々のインスタンスの … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

LoRID: Low-Rank Iterative Diffusion for Adversarial Purification

Derivative-Free Guidance in Continuous and Discrete Diffusion Models with Soft Value-Based Decoding

Windows Agent Arena: Evaluating Multi-Modal OS Agents at Scale

AnySkin: Plug-and-play Skin Sensing for Robotic Touch

NITRO-D: Native Integer-only Training of Deep Convolutional Neural Networks

Unified Domain Adaptive Semantic Segmentation

Zero-Shot Whole Slide Image Retrieval in Histopathology Using Embeddings of Foundation Models

What Makes a Maze Look Like a Maze?

LT3SD: Latent Trees for 3D Scene Diffusion

IFAdapter: Instance Feature Control for Grounded Text-to-Image Generation

最近の投稿

最近のコメント

アーカイブ

カテゴリー