cs.CV」カテゴリーアーカイブ

Guess What I Think: Streamlined EEG-to-Image Generation with Latent Diffusion Models

要約 脳波から画像を生成することは、脳信号がどのように視覚的手がかりをエンコード … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Guess What I Think: Streamlined EEG-to-Image Generation with Latent Diffusion Models はコメントを受け付けていません

PySpatial: A High-Speed Whole Slide Image Pathomics Toolkit

要約 全体スライド画像 (WSI) 解析は、現代のデジタル病理学において重要な役 … 続きを読む

カテゴリー: cs.CV, eess.IV | PySpatial: A High-Speed Whole Slide Image Pathomics Toolkit はコメントを受け付けていません

VideoAuteur: Towards Long Narrative Video Generation

要約 最近のビデオ生成モデルは、数秒続く高品質のビデオ クリップの生成において有 … 続きを読む

カテゴリー: cs.CV | VideoAuteur: Towards Long Narrative Video Generation はコメントを受け付けていません

PEACE: Empowering Geologic Map Holistic Understanding with MLLMs

要約 地質図は、地質科学の基本的な図として、地球の地下と表面の構造と組成について … 続きを読む

カテゴリー: cs.CV, cs.MA | PEACE: Empowering Geologic Map Holistic Understanding with MLLMs はコメントを受け付けていません

LlamaV-o1: Rethinking Step-by-step Visual Reasoning in LLMs

要約 推論は、複雑な複数ステップの問題を解決するための基本的な能力であり、特に視 … 続きを読む

カテゴリー: cs.CV | LlamaV-o1: Rethinking Step-by-step Visual Reasoning in LLMs はコメントを受け付けていません

Multi-subject Open-set Personalization in Video Generation

要約 ビデオのパーソナライゼーション手法を使用すると、人物、ペット、場所などの特 … 続きを読む

カテゴリー: cs.CV | Multi-subject Open-set Personalization in Video Generation はコメントを受け付けていません

Atlas: A Novel Pathology Foundation Model by Mayo Clinic, Charité, and Aignostics

要約 デジタルパソロジーの最近の進歩により、さまざまなアプリケーションにわたる基 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Atlas: A Novel Pathology Foundation Model by Mayo Clinic, Charité, and Aignostics はコメントを受け付けていません

Decentralized Diffusion Models

要約 大規模な AI モデルのトレーニングでは、数千の GPU に作業を分割し、 … 続きを読む

カテゴリー: cs.CV, cs.DC, cs.LG | Decentralized Diffusion Models はコメントを受け付けていません

HipyrNet: Hypernet-Guided Feature Pyramid network for mixed-exposure correction

要約 混合露出画像を強化するための画像変換の最近の進歩により、深層学習アルゴリズ … 続きを読む

カテゴリー: cs.CV | HipyrNet: Hypernet-Guided Feature Pyramid network for mixed-exposure correction はコメントを受け付けていません

Enhancing Vision-Language Models with Scene Graphs for Traffic Accident Understanding

要約 交通事故の認識は、自動運転システムや道路監視システムにとって不可欠な部分で … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Enhancing Vision-Language Models with Scene Graphs for Traffic Accident Understanding はコメントを受け付けていません