投稿者「jarxiv」のアーカイブ

Real-Time Video Generation with Pyramid Attention Broadcast

要約 DITベースのビデオ生成のためのリアルタイムで高品質でトレーニングなしのア … 続きを読む

カテゴリー: cs.CV, cs.DC | Real-Time Video Generation with Pyramid Attention Broadcast はコメントを受け付けていません

VICCA: Visual Interpretation and Comprehension of Chest X-ray Anomalies in Generated Report Without Human Feedback

要約 人工知能(AI)がヘルスケアの中心になるにつれて、説明可能で信頼できるモデ … 続きを読む

カテゴリー: cs.CL, cs.CV | VICCA: Visual Interpretation and Comprehension of Chest X-ray Anomalies in Generated Report Without Human Feedback はコメントを受け付けていません

Polyp-Gen: Realistic and Diverse Polyp Image Generation for Endoscopic Dataset Expansion

要約 自動診断システム(ADS)は、内視鏡検査中のポリープの早期発見において重大 … 続きを読む

カテゴリー: cs.CV | Polyp-Gen: Realistic and Diverse Polyp Image Generation for Endoscopic Dataset Expansion はコメントを受け付けていません

Zero-Shot Medical Phrase Grounding with Off-the-shelf Diffusion Models

要約 特定の医療スキャンで正確な病理学的領域を局在することは、従来、大量の境界の … 続きを読む

カテゴリー: cs.CV, cs.LG | Zero-Shot Medical Phrase Grounding with Off-the-shelf Diffusion Models はコメントを受け付けていません

Stroke classification using Virtual Hybrid Edge Detection from in silico electrical impedance tomography data

要約 電気インピーダンス断層撮影(EIT)は、電気境界測定から身体の内部導電性を … 続きを読む

カテゴリー: cs.CV, cs.NA, math.AP, math.NA | Stroke classification using Virtual Hybrid Edge Detection from in silico electrical impedance tomography data はコメントを受け付けていません

Glioma Multimodal MRI Analysis System for Tumor Layered Diagnosis via Multi-task Semi-supervised Learning

要約 膠腫は、中枢神経系の最も一般的な原発腫瘍です。 マルチモーダルMRIは、神 … 続きを読む

カテゴリー: cs.CV, eess.IV | Glioma Multimodal MRI Analysis System for Tumor Layered Diagnosis via Multi-task Semi-supervised Learning はコメントを受け付けていません

PIR: Photometric Inverse Rendering with Shading Cues Modeling and Surface Reflectance Regularization

要約 この論文では、測光画像からの逆レンダリングの問題に対処します。 この問題の … 続きを読む

カテゴリー: cs.CV | PIR: Photometric Inverse Rendering with Shading Cues Modeling and Surface Reflectance Regularization はコメントを受け付けていません

CrowdSplat: Exploring Gaussian Splatting For Crowd Rendering

要約 CrowdSplatを提示します。これは、3D Gaussian Spla … 続きを読む

カテゴリー: cs.CV | CrowdSplat: Exploring Gaussian Splatting For Crowd Rendering はコメントを受け付けていません

Janus-Pro: Unified Multimodal Understanding and Generation with Data and Model Scaling

要約 この作業では、以前の作品ヤヌスの高度なバージョンであるヤヌスプロを紹介しま … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Janus-Pro: Unified Multimodal Understanding and Generation with Data and Model Scaling はコメントを受け付けていません

P-TAME: Explain Any Image Classifier with Trained Perturbations

要約 予測を正当化する必要がある重要な分野での深いニューラルネットワーク(DNN … 続きを読む

カテゴリー: cs.AI, cs.CV | P-TAME: Explain Any Image Classifier with Trained Perturbations はコメントを受け付けていません