cs.AI」カテゴリーアーカイブ

Make-An-Agent: A Generalizable Policy Network Generator with Behavior-Prompted Diffusion

要約 テキストによる説明から画像を作成するのと同じくらい簡単に、望ましい動作の … 続きを読む

カテゴリー: cs.AI | Make-An-Agent: A Generalizable Policy Network Generator with Behavior-Prompted Diffusion はコメントを受け付けていません

Mammographic Breast Positioning Assessment via Deep Learning

要約 乳がんは依然として世界中の女性のがん関連死亡の主な原因であり、早期発見のた … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV, J.3 | Mammographic Breast Positioning Assessment via Deep Learning はコメントを受け付けていません

FabGPT: An Efficient Large Multimodal Model for Complex Wafer Defect Knowledge Queries

要約 インテリジェンスは集積回路 (IC) 製造を進歩させる鍵です。 大規模マル … 続きを読む

カテゴリー: cs.AI, cs.AR, cs.CV, cs.LG | FabGPT: An Efficient Large Multimodal Model for Complex Wafer Defect Knowledge Queries はコメントを受け付けていません

GPT Sonograpy: Hand Gesture Decoding from Forearm Ultrasound Images via VLM

要約 Generative Pre-trained Transformer 4- … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.HC, cs.LG | GPT Sonograpy: Hand Gesture Decoding from Forearm Ultrasound Images via VLM はコメントを受け付けていません

DiagrammerGPT: Generating Open-Domain, Open-Platform Diagrams via LLM Planning

要約 Text-to-Image (T2I) の生成は、過去数年間で大幅に増加し … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | DiagrammerGPT: Generating Open-Domain, Open-Platform Diagrams via LLM Planning はコメントを受け付けていません

Leveraging Multimodal CycleGAN for the Generation of Anatomically Accurate Synthetic CT Scans from MRIs

要約 多くの臨床現場では、患者の解剖学的構造を徹底的に理解し、適切な治療戦略を計 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | Leveraging Multimodal CycleGAN for the Generation of Anatomically Accurate Synthetic CT Scans from MRIs はコメントを受け付けていません

Benchmarking Vision Language Models for Cultural Understanding

要約 基礎モデルと視覚言語の事前トレーニングには、特に高度な視覚言語モデル (V … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Benchmarking Vision Language Models for Cultural Understanding はコメントを受け付けていません

SQ-LLaVA: Self-Questioning for Large Vision-Language Assistant

要約 視覚言語モデルの最近の進歩により、視覚的命令の調整を通じて幅広いタスクが顕 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | SQ-LLaVA: Self-Questioning for Large Vision-Language Assistant はコメントを受け付けていません

Ref-AVS: Refer and Segment Objects in Audio-Visual Scenes

要約 従来の参照セグメンテーション タスクは主に静かな視覚シーンに焦点を当ててお … 続きを読む

カテゴリー: cs.AI, cs.CV | Ref-AVS: Refer and Segment Objects in Audio-Visual Scenes はコメントを受け付けていません

VGBench: Evaluating Large Language Models on Vector Graphics Understanding and Generation

要約 視覚モデルの領域では、主な表現モードはピクセルを使用して視覚世界をラスタラ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | VGBench: Evaluating Large Language Models on Vector Graphics Understanding and Generation はコメントを受け付けていません