cs.AI」カテゴリーアーカイブ

Hallucination Benchmark in Medical Visual Question Answering

要約 視覚質問応答 (VQA) に関する大規模な言語および視覚モデルの最近の成功 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Hallucination Benchmark in Medical Visual Question Answering はコメントを受け付けていません

HiCAST: Highly Customized Arbitrary Style Transfer with Adapter Enhanced Diffusion Models

要約 Arbitrary Style Transfer (AST) の目標は、ス … 続きを読む

カテゴリー: cs.AI, cs.CV | HiCAST: Highly Customized Arbitrary Style Transfer with Adapter Enhanced Diffusion Models はコメントを受け付けていません

Machine Learning Applications in Traumatic Brain Injury: A Spotlight on Mild TBI

要約 外傷性脳損傷(TBI)は、世界的な公衆衛生上の重大な課題を引き起こしており … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, eess.IV | Machine Learning Applications in Traumatic Brain Injury: A Spotlight on Mild TBI はコメントを受け付けていません

CoSSegGaussians: Compact and Swift Scene Segmenting 3D Gaussians

要約 我々は、RGB画像のみを入力して、高速なレンダリング速度でコンパクトな3D … 続きを読む

カテゴリー: cs.AI, cs.CV | CoSSegGaussians: Compact and Swift Scene Segmenting 3D Gaussians はコメントを受け付けていません

Heterogeneous Generative Knowledge Distillation with Masked Image Modeling

要約 通常、小規模な CNN ベースのモデルは、計算リソースが制限されたエッジ … 続きを読む

カテゴリー: cs.AI, cs.CV | Heterogeneous Generative Knowledge Distillation with Masked Image Modeling はコメントを受け付けていません

An attempt to generate new bridge types from latent space of PixelCNN

要約 生成人工知能テクノロジーを使用して、新しい種類の橋を生成してみます。 Py … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | An attempt to generate new bridge types from latent space of PixelCNN はコメントを受け付けていません

How does the primate brain combine generative and discriminative computations in vision?

要約 ビジョンは推論問題として広く理解されています。 しかし、推論プロセスの 2 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, q-bio.NC | How does the primate brain combine generative and discriminative computations in vision? はコメントを受け付けていません

Surgical-DINO: Adapter Learning of Foundation Model for Depth Estimation in Endoscopic Surgery

要約 目的: ロボット手術における深さの推定は、3D 再構成、手術ナビゲーション … 続きを読む

カテゴリー: cs.AI, cs.CV | Surgical-DINO: Adapter Learning of Foundation Model for Depth Estimation in Endoscopic Surgery はコメントを受け付けていません

Linear Spaces of Meanings: Compositional Structures in Vision-Language Models

要約 私たちは、事前にトレーニングされたビジョン言語モデル (VLM) からデー … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Linear Spaces of Meanings: Compositional Structures in Vision-Language Models はコメントを受け付けていません

Manipulating Feature Visualizations with Gradient Slingshots

要約 ディープ ニューラル ネットワーク (DNN) は、複雑で多彩な表現を学習 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Manipulating Feature Visualizations with Gradient Slingshots はコメントを受け付けていません