投稿者「jarxiv」のアーカイブ

Towards a deep learning approach for classifying treatment response in glioblastomas

要約 膠芽腫は、最も攻撃的なタイプの神経膠腫であり、5年生存率は6.9%です。 … 続きを読む

カテゴリー: cs.CV, eess.IV | Towards a deep learning approach for classifying treatment response in glioblastomas はコメントを受け付けていません

TextTIGER: Text-based Intelligent Generation with Entity Prompt Refinement for Text-to-Image Generation

要約 特定のエンティティを含むプロンプトから画像を生成するには、モデルができるだ … 続きを読む

カテゴリー: cs.CL, cs.CV | TextTIGER: Text-based Intelligent Generation with Entity Prompt Refinement for Text-to-Image Generation はコメントを受け付けていません

All for One, and One for All: UrbanSyn Dataset, the third Musketeer of Synthetic Driving Scenes

要約 urbansynを紹介します。これは、半プロセッドで生成された合成都市駆動 … 続きを読む

カテゴリー: cs.CV | All for One, and One for All: UrbanSyn Dataset, the third Musketeer of Synthetic Driving Scenes はコメントを受け付けていません

Seeing Soundscapes: Audio-Visual Generation and Separation from Soundscapes Using Audio-Visual Separator

要約 最近の視聴覚生成モデルは、オーディオから画像を生成する際に大きな進歩を遂げ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM, cs.SD, eess.AS | Seeing Soundscapes: Audio-Visual Generation and Separation from Soundscapes Using Audio-Visual Separator はコメントを受け付けていません

Enhancing Long-Term Re-Identification Robustness Using Synthetic Data: A Comparative Analysis

要約 この貢献は、合成トレーニングデータの使用の影響と、再識別の文脈における材料 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, I.2.10 | Enhancing Long-Term Re-Identification Robustness Using Synthetic Data: A Comparative Analysis はコメントを受け付けていません

EMT: A Visual Multi-Task Benchmark Dataset for Autonomous Driving in the Arab Gulf Region

要約 このペーパーでは、統一されたフレームワーク内でのマルチタスクベンチマークを … 続きを読む

カテゴリー: cs.AI, cs.CV | EMT: A Visual Multi-Task Benchmark Dataset for Autonomous Driving in the Arab Gulf Region はコメントを受け付けていません

VisTabNet: Adapting Vision Transformers for Tabular Data

要約 ディープラーニングモデルは自然言語の処理とコンピュータービジョンで大きな成 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | VisTabNet: Adapting Vision Transformers for Tabular Data はコメントを受け付けていません

StoryGPT-V: Large Language Models as Consistent Story Visualizers

要約 最近の生成モデルは、テキストプロンプトに基づいた現実的で視覚的に心地よい画 … 続きを読む

カテゴリー: cs.CV | StoryGPT-V: Large Language Models as Consistent Story Visualizers はコメントを受け付けていません

Task-Oriented Communications for Visual Navigation with Edge-Aerial Collaboration in Low Altitude Economy

要約 低高度経済(LAE)をサポートするために、世界的なポジショニングシステム( … 続きを読む

カテゴリー: cs.CV, cs.NI | Task-Oriented Communications for Visual Navigation with Edge-Aerial Collaboration in Low Altitude Economy はコメントを受け付けていません

STP4D: Spatio-Temporal-Prompt Consistent Modeling for Text-to-4D Gaussian Splatting

要約 テキストから4Dの世代は急速に開発されており、さまざまなシナリオで広く適用 … 続きを読む

カテゴリー: cs.CV | STP4D: Spatio-Temporal-Prompt Consistent Modeling for Text-to-4D Gaussian Splatting はコメントを受け付けていません