「cs.AI」カテゴリーアーカイブ

Make-An-Agent: A Generalizable Policy Network Generator with Behavior-Prompted Diffusion

投稿日: 2024年7月16日作成者: jarxiv

要約テキストによる説明から画像を作成するのと同じくらい簡単に、望ましい動作の … 続きを読む →

カテゴリー: cs.AI | コメントを受け付けていません

Mammographic Breast Positioning Assessment via Deep Learning

投稿日: 2024年7月16日作成者: jarxiv

要約乳がんは依然として世界中の女性のがん関連死亡の主な原因であり、早期発見のた … 続きを読む →

カテゴリー: cs.AI, cs.CV, eess.IV, J.3 | コメントを受け付けていません

FabGPT: An Efficient Large Multimodal Model for Complex Wafer Defect Knowledge Queries

投稿日: 2024年7月16日作成者: jarxiv

要約インテリジェンスは集積回路 (IC) 製造を進歩させる鍵です。大規模マル … 続きを読む →

カテゴリー: cs.AI, cs.AR, cs.CV, cs.LG | コメントを受け付けていません

GPT Sonograpy: Hand Gesture Decoding from Forearm Ultrasound Images via VLM

投稿日: 2024年7月16日作成者: jarxiv

要約 Generative Pre-trained Transformer 4- … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.HC, cs.LG | コメントを受け付けていません

DiagrammerGPT: Generating Open-Domain, Open-Platform Diagrams via LLM Planning

投稿日: 2024年7月16日作成者: jarxiv

要約 Text-to-Image (T2I) の生成は、過去数年間で大幅に増加し … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Leveraging Multimodal CycleGAN for the Generation of Anatomically Accurate Synthetic CT Scans from MRIs

投稿日: 2024年7月16日作成者: jarxiv

要約多くの臨床現場では、患者の解剖学的構造を徹底的に理解し、適切な治療戦略を計 … 続きを読む →

カテゴリー: cs.AI, cs.CV, eess.IV | コメントを受け付けていません

Benchmarking Vision Language Models for Cultural Understanding

投稿日: 2024年7月16日作成者: jarxiv

要約基礎モデルと視覚言語の事前トレーニングには、特に高度な視覚言語モデル (V … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

SQ-LLaVA: Self-Questioning for Large Vision-Language Assistant

投稿日: 2024年7月16日作成者: jarxiv

要約視覚言語モデルの最近の進歩により、視覚的命令の調整を通じて幅広いタスクが顕 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Ref-AVS: Refer and Segment Objects in Audio-Visual Scenes

投稿日: 2024年7月16日作成者: jarxiv

要約従来の参照セグメンテーションタスクは主に静かな視覚シーンに焦点を当ててお … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

VGBench: Evaluating Large Language Models on Vector Graphics Understanding and Generation

投稿日: 2024年7月16日作成者: jarxiv

要約視覚モデルの領域では、主な表現モードはピクセルを使用して視覚世界をラスタラ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

Make-An-Agent: A Generalizable Policy Network Generator with Behavior-Prompted Diffusion

Mammographic Breast Positioning Assessment via Deep Learning

FabGPT: An Efficient Large Multimodal Model for Complex Wafer Defect Knowledge Queries

GPT Sonograpy: Hand Gesture Decoding from Forearm Ultrasound Images via VLM

DiagrammerGPT: Generating Open-Domain, Open-Platform Diagrams via LLM Planning

Leveraging Multimodal CycleGAN for the Generation of Anatomically Accurate Synthetic CT Scans from MRIs

Benchmarking Vision Language Models for Cultural Understanding

SQ-LLaVA: Self-Questioning for Large Vision-Language Assistant

Ref-AVS: Refer and Segment Objects in Audio-Visual Scenes

VGBench: Evaluating Large Language Models on Vector Graphics Understanding and Generation

最近の投稿

最近のコメント

アーカイブ

カテゴリー