投稿者「jarxiv」のアーカイブ

ViGiL3D: A Linguistically Diverse Dataset for 3D Visual Grounding

要約 3Dビジュアルグラウンディング(3DVG)は、自然言語テキストによって参照 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | ViGiL3D: A Linguistically Diverse Dataset for 3D Visual Grounding はコメントを受け付けていません

Test-time Controllable Image Generation by Explicit Spatial Constraint Enforcement

要約 最近のテキストから画像への生成では、マスク、バウンディングボックス、キーポ … 続きを読む

カテゴリー: cs.CV | Test-time Controllable Image Generation by Explicit Spatial Constraint Enforcement はコメントを受け付けていません

CLIP-UP: CLIP-Based Unanswerable Problem Detection for Visual Question Answering

要約 最近の視覚言語モデル(VLM)は、視覚理解と推論、特に多肢選択式視覚質問応 … 続きを読む

カテゴリー: cs.CV | CLIP-UP: CLIP-Based Unanswerable Problem Detection for Visual Question Answering はコメントを受け付けていません

ScarNet: A Novel Foundation Model for Automated Myocardial Scar Quantification from LGE in Cardiac MRI

要約 背景後期ガドリニウム増強(LGE)画像は心筋線維化と瘢痕を評価するためのゴ … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | ScarNet: A Novel Foundation Model for Automated Myocardial Scar Quantification from LGE in Cardiac MRI はコメントを受け付けていません

Iris Recognition for Infants

要約 非侵襲的、効率的、物理的トークン不要、正確かつ安定した新生児の識別方法は、 … 続きを読む

カテゴリー: cs.CV | Iris Recognition for Infants はコメントを受け付けていません

Training Medical Large Vision-Language Models with Abnormal-Aware Feedback

要約 既存の医療用大型視覚言語モデル(Medical Large Vision- … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Training Medical Large Vision-Language Models with Abnormal-Aware Feedback はコメントを受け付けていません

ProjectedEx: Enhancing Generation in Explainable AI for Prostate Cancer

要約 世界的な健康問題の一つである前立腺がんは、診断精度を大幅に向上させる高解像 … 続きを読む

カテゴリー: cs.CV, eess.IV | ProjectedEx: Enhancing Generation in Explainable AI for Prostate Cancer はコメントを受け付けていません

Learning 3D Garment Animation from Trajectories of A Piece of Cloth

要約 衣服のアニメーションは、バーチャルリアリティ、ゲーム、映画制作など、様々な … 続きを読む

カテゴリー: cs.CV, cs.GR | Learning 3D Garment Animation from Trajectories of A Piece of Cloth はコメントを受け付けていません

nnY-Net: Swin-NeXt with Cross-Attention for 3D Medical Images Segmentation

要約 本論文では、nnY-Netと呼ばれる新しい3次元医用画像セグメンテーション … 続きを読む

カテゴリー: cs.CV | nnY-Net: Swin-NeXt with Cross-Attention for 3D Medical Images Segmentation はコメントを受け付けていません

Nested Attention: Semantic-aware Attention Values for Concept Personalization

要約 多様なシーンやスタイルにおける特定の被写体の画像を生成するために、テキスト … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.LG | Nested Attention: Semantic-aware Attention Values for Concept Personalization はコメントを受け付けていません