月別アーカイブ: 2025年1月

VideoAuteur: Towards Long Narrative Video Generation

投稿日: 2025年1月13日作成者: jarxiv

要約最近のビデオ生成モデルは、数秒続く高品質のビデオクリップの生成において有 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

PEACE: Empowering Geologic Map Holistic Understanding with MLLMs

投稿日: 2025年1月13日作成者: jarxiv

要約地質図は、地質科学の基本的な図として、地球の地下と表面の構造と組成について … 続きを読む →

カテゴリー: cs.CV, cs.MA | コメントを受け付けていません

LlamaV-o1: Rethinking Step-by-step Visual Reasoning in LLMs

投稿日: 2025年1月13日作成者: jarxiv

要約推論は、複雑な複数ステップの問題を解決するための基本的な能力であり、特に視 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Multi-subject Open-set Personalization in Video Generation

投稿日: 2025年1月13日作成者: jarxiv

要約ビデオのパーソナライゼーション手法を使用すると、人物、ペット、場所などの特 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Exploring the Use of Robots for Diary Studies

投稿日: 2025年1月13日作成者: jarxiv

要約自然界での人間とロボットのインタラクションの研究への関心が高まるにつれ、自 … 続きを読む →

カテゴリー: cs.HC, cs.RO | コメントを受け付けていません

Atlas: A Novel Pathology Foundation Model by Mayo Clinic, Charité, and Aignostics

投稿日: 2025年1月13日作成者: jarxiv

要約デジタルパソロジーの最近の進歩により、さまざまなアプリケーションにわたる基 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Decentralized Diffusion Models

投稿日: 2025年1月13日作成者: jarxiv

要約大規模な AI モデルのトレーニングでは、数千の GPU に作業を分割し、 … 続きを読む →

カテゴリー: cs.CV, cs.DC, cs.LG | コメントを受け付けていません

SensorQA: A Question Answering Benchmark for Daily-Life Monitoring

投稿日: 2025年1月13日作成者: jarxiv

要約センサーデータの急速な増加に伴い、人間が理解できる方法でこれらのデータを効 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

A General Retrieval-Augmented Generation Framework for Multimodal Case-Based Reasoning Applications

投稿日: 2025年1月12日作成者: jarxiv

要約ケースベース推論 (CBR) は、問題解決に対する経験ベースのアプローチで … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

HipyrNet: Hypernet-Guided Feature Pyramid network for mixed-exposure correction

投稿日: 2025年1月12日作成者: jarxiv

要約混合露出画像を強化するための画像変換の最近の進歩により、深層学習アルゴリズ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

月別アーカイブ: 2025年1月

VideoAuteur: Towards Long Narrative Video Generation

PEACE: Empowering Geologic Map Holistic Understanding with MLLMs

LlamaV-o1: Rethinking Step-by-step Visual Reasoning in LLMs

Multi-subject Open-set Personalization in Video Generation

Exploring the Use of Robots for Diary Studies

Atlas: A Novel Pathology Foundation Model by Mayo Clinic, Charité, and Aignostics

Decentralized Diffusion Models

SensorQA: A Question Answering Benchmark for Daily-Life Monitoring

A General Retrieval-Augmented Generation Framework for Multimodal Case-Based Reasoning Applications

HipyrNet: Hypernet-Guided Feature Pyramid network for mixed-exposure correction

最近の投稿

最近のコメント

アーカイブ

カテゴリー