投稿者「jarxiv」のアーカイブ

Guess What I Think: Streamlined EEG-to-Image Generation with Latent Diffusion Models

要約 脳波から画像を生成することは、脳信号がどのように視覚的手がかりをエンコード … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Guess What I Think: Streamlined EEG-to-Image Generation with Latent Diffusion Models はコメントを受け付けていません

PySpatial: A High-Speed Whole Slide Image Pathomics Toolkit

要約 全体スライド画像 (WSI) 解析は、現代のデジタル病理学において重要な役 … 続きを読む

カテゴリー: cs.CV, eess.IV | PySpatial: A High-Speed Whole Slide Image Pathomics Toolkit はコメントを受け付けていません

VideoAuteur: Towards Long Narrative Video Generation

要約 最近のビデオ生成モデルは、数秒続く高品質のビデオ クリップの生成において有 … 続きを読む

カテゴリー: cs.CV | VideoAuteur: Towards Long Narrative Video Generation はコメントを受け付けていません

PEACE: Empowering Geologic Map Holistic Understanding with MLLMs

要約 地質図は、地質科学の基本的な図として、地球の地下と表面の構造と組成について … 続きを読む

カテゴリー: cs.CV, cs.MA | PEACE: Empowering Geologic Map Holistic Understanding with MLLMs はコメントを受け付けていません

LlamaV-o1: Rethinking Step-by-step Visual Reasoning in LLMs

要約 推論は、複雑な複数ステップの問題を解決するための基本的な能力であり、特に視 … 続きを読む

カテゴリー: cs.CV | LlamaV-o1: Rethinking Step-by-step Visual Reasoning in LLMs はコメントを受け付けていません

Multi-subject Open-set Personalization in Video Generation

要約 ビデオのパーソナライゼーション手法を使用すると、人物、ペット、場所などの特 … 続きを読む

カテゴリー: cs.CV | Multi-subject Open-set Personalization in Video Generation はコメントを受け付けていません

Exploring the Use of Robots for Diary Studies

要約 自然界での人間とロボットのインタラクションの研究への関心が高まるにつれ、自 … 続きを読む

カテゴリー: cs.HC, cs.RO | Exploring the Use of Robots for Diary Studies はコメントを受け付けていません

Atlas: A Novel Pathology Foundation Model by Mayo Clinic, Charité, and Aignostics

要約 デジタルパソロジーの最近の進歩により、さまざまなアプリケーションにわたる基 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Atlas: A Novel Pathology Foundation Model by Mayo Clinic, Charité, and Aignostics はコメントを受け付けていません

Decentralized Diffusion Models

要約 大規模な AI モデルのトレーニングでは、数千の GPU に作業を分割し、 … 続きを読む

カテゴリー: cs.CV, cs.DC, cs.LG | Decentralized Diffusion Models はコメントを受け付けていません

SensorQA: A Question Answering Benchmark for Daily-Life Monitoring

要約 センサーデータの急速な増加に伴い、人間が理解できる方法でこれらのデータを効 … 続きを読む

カテゴリー: cs.AI, cs.CL | SensorQA: A Question Answering Benchmark for Daily-Life Monitoring はコメントを受け付けていません