月別アーカイブ: 2025年1月

VideoAuteur: Towards Long Narrative Video Generation

要約 最近のビデオ生成モデルは、数秒続く高品質のビデオ クリップの生成において有 … 続きを読む

カテゴリー: cs.CV | VideoAuteur: Towards Long Narrative Video Generation はコメントを受け付けていません

PEACE: Empowering Geologic Map Holistic Understanding with MLLMs

要約 地質図は、地質科学の基本的な図として、地球の地下と表面の構造と組成について … 続きを読む

カテゴリー: cs.CV, cs.MA | PEACE: Empowering Geologic Map Holistic Understanding with MLLMs はコメントを受け付けていません

LlamaV-o1: Rethinking Step-by-step Visual Reasoning in LLMs

要約 推論は、複雑な複数ステップの問題を解決するための基本的な能力であり、特に視 … 続きを読む

カテゴリー: cs.CV | LlamaV-o1: Rethinking Step-by-step Visual Reasoning in LLMs はコメントを受け付けていません

Multi-subject Open-set Personalization in Video Generation

要約 ビデオのパーソナライゼーション手法を使用すると、人物、ペット、場所などの特 … 続きを読む

カテゴリー: cs.CV | Multi-subject Open-set Personalization in Video Generation はコメントを受け付けていません

Exploring the Use of Robots for Diary Studies

要約 自然界での人間とロボットのインタラクションの研究への関心が高まるにつれ、自 … 続きを読む

カテゴリー: cs.HC, cs.RO | Exploring the Use of Robots for Diary Studies はコメントを受け付けていません

Atlas: A Novel Pathology Foundation Model by Mayo Clinic, Charité, and Aignostics

要約 デジタルパソロジーの最近の進歩により、さまざまなアプリケーションにわたる基 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Atlas: A Novel Pathology Foundation Model by Mayo Clinic, Charité, and Aignostics はコメントを受け付けていません

Decentralized Diffusion Models

要約 大規模な AI モデルのトレーニングでは、数千の GPU に作業を分割し、 … 続きを読む

カテゴリー: cs.CV, cs.DC, cs.LG | Decentralized Diffusion Models はコメントを受け付けていません

SensorQA: A Question Answering Benchmark for Daily-Life Monitoring

要約 センサーデータの急速な増加に伴い、人間が理解できる方法でこれらのデータを効 … 続きを読む

カテゴリー: cs.AI, cs.CL | SensorQA: A Question Answering Benchmark for Daily-Life Monitoring はコメントを受け付けていません

A General Retrieval-Augmented Generation Framework for Multimodal Case-Based Reasoning Applications

要約 ケースベース推論 (CBR) は、問題解決に対する経験ベースのアプローチで … 続きを読む

カテゴリー: cs.AI, cs.CL | A General Retrieval-Augmented Generation Framework for Multimodal Case-Based Reasoning Applications はコメントを受け付けていません

HipyrNet: Hypernet-Guided Feature Pyramid network for mixed-exposure correction

要約 混合露出画像を強化するための画像変換の最近の進歩により、深層学習アルゴリズ … 続きを読む

カテゴリー: cs.CV | HipyrNet: Hypernet-Guided Feature Pyramid network for mixed-exposure correction はコメントを受け付けていません