月別アーカイブ: 2025年5月

Edge Detection based on Channel Attention and Inter-region Independence Test

投稿日: 2025年5月5日作成者: jarxiv

要約既存のエッジ検出手法は、ノイズの増幅や非サリエントなディテールの過剰な保持 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Transferable Adversarial Attacks on Black-Box Vision-Language Models

投稿日: 2025年5月5日作成者: jarxiv

要約 Vision Large Language Models（VLLM）は、テ … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

GeloVec: Higher Dimensional Geometric Smoothing for Coherent Visual Feature Extraction in Image Segmentation

投稿日: 2025年5月5日作成者: jarxiv

要約本稿では、セマンティックセグメンテーションのための新しいCNNベースの注意 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Efficient Vocabulary-Free Fine-Grained Visual Recognition in the Age of Multimodal LLMs

投稿日: 2025年5月5日作成者: jarxiv

要約きめ細かな視覚認識（FGVR）には、視覚的に類似したカテゴリーを区別するこ … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

MAVEN: Multi-modal Attention for Valence-Arousal Emotion Network

投稿日: 2025年5月5日作成者: jarxiv

要約感情表現は一過性のものであり、マルチモーダルな手がかりの時間的なずれがある … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | コメントを受け付けていません

Improving Editability in Image Generation with Layer-wise Memory

投稿日: 2025年5月5日作成者: jarxiv

要約現実の画像編集作業の多くは、望ましい結果を得るために複数の連続した編集を必 … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

Towards Space Group Determination from EBSD Patterns: The Role of Deep Learning and High-throughput Dynamical Simulations

投稿日: 2025年5月5日作成者: jarxiv

要約新規材料の設計は、構造と物性の関係の理解にかかっている。しかし最近では、多 … 続きを読む →

カテゴリー: cond-mat.mtrl-sci, cs.CV | コメントを受け付けていません

Any-to-Any Vision-Language Model for Multimodal X-ray Imaging and Radiological Report Generation

投稿日: 2025年5月5日作成者: jarxiv

要約生成モデルは、特にマルチモーダルアプリケーションにおいて、人工知能（AI） … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Evaluating Vision Language Model Adaptations for Radiology Report Generation in Low-Resource Languages

投稿日: 2025年5月5日作成者: jarxiv

要約ヘルスケアにおける人工知能の統合は、医療診断と患者ケアを改善するための新た … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

VSC: Visual Search Compositional Text-to-Image Diffusion Model

投稿日: 2025年5月5日作成者: jarxiv

要約テキストから画像への拡散モデルは、自然言語によるプロンプトからリアルなビジ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

月別アーカイブ: 2025年5月

Edge Detection based on Channel Attention and Inter-region Independence Test

Transferable Adversarial Attacks on Black-Box Vision-Language Models

GeloVec: Higher Dimensional Geometric Smoothing for Coherent Visual Feature Extraction in Image Segmentation

Efficient Vocabulary-Free Fine-Grained Visual Recognition in the Age of Multimodal LLMs

MAVEN: Multi-modal Attention for Valence-Arousal Emotion Network

Improving Editability in Image Generation with Layer-wise Memory

Towards Space Group Determination from EBSD Patterns: The Role of Deep Learning and High-throughput Dynamical Simulations

Any-to-Any Vision-Language Model for Multimodal X-ray Imaging and Radiological Report Generation

Evaluating Vision Language Model Adaptations for Radiology Report Generation in Low-Resource Languages

VSC: Visual Search Compositional Text-to-Image Diffusion Model

最近の投稿

最近のコメント

アーカイブ

カテゴリー