月別アーカイブ: 2025年1月

A Novel Pathology Foundation Model by Mayo Clinic, Charité, and Aignostics

要約 デジタルパソロジーの最近の進歩により、さまざまなアプリケーションにわたる基 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | A Novel Pathology Foundation Model by Mayo Clinic, Charité, and Aignostics はコメントを受け付けていません

Seeing Sound: Assembling Sounds from Visuals for Audio-to-Image Generation

要約 音声から画像への生成モデルをトレーニングするには、意味的に整合した多様な音 … 続きを読む

カテゴリー: cs.CV, cs.SD, eess.AS | Seeing Sound: Assembling Sounds from Visuals for Audio-to-Image Generation はコメントを受け付けていません

From Images to Insights: Transforming Brain Cancer Diagnosis with Explainable AI

要約 脳腫瘍は医療診断における大きな課題であり、効果的な治療には正確かつタイムリ … 続きを読む

カテゴリー: cs.CV | From Images to Insights: Transforming Brain Cancer Diagnosis with Explainable AI はコメントを受け付けていません

Zero-1-to-G: Taming Pretrained 2D Diffusion Model for Direct 3D Generation

要約 2D 画像生成の最近の進歩は、主に拡散モデルの能力と大規模なデータセットの … 続きを読む

カテゴリー: cs.CV | Zero-1-to-G: Taming Pretrained 2D Diffusion Model for Direct 3D Generation はコメントを受け付けていません

Flatland Vision

要約 一対の投影面にある 2 組のラベル付き点を投影線上の同じ画像に投影できるの … 続きを読む

カテゴリー: cs.CV, math.AG | Flatland Vision はコメントを受け付けていません

AgroGPT: Efficient Agricultural Vision-Language Model with Expert Tuning

要約 オンラインで入手可能な画像テキスト データの膨大なリポジトリを活用して、大 … 続きを読む

カテゴリー: cs.AI, cs.CV | AgroGPT: Efficient Agricultural Vision-Language Model with Expert Tuning はコメントを受け付けていません

Gradient-based facial encoding for key generation to encrypt and decrypt multimedia data

要約 パスワードに依存するセキュリティ システムは、忘れられたり、推測されたり、 … 続きを読む

カテゴリー: cs.CR, cs.CV | Gradient-based facial encoding for key generation to encrypt and decrypt multimedia data はコメントを受け付けていません

$DPF^*$: improved Depth Potential Function for scale-invariant sulcal depth estimation

要約 人間の脳の形状は複雑で非常に多様であり、脳の大きさ、皮質の折り畳み、年齢の … 続きを読む

カテゴリー: cs.CV | $DPF^*$: improved Depth Potential Function for scale-invariant sulcal depth estimation はコメントを受け付けていません

The GAN is dead; long live the GAN! A Modern GAN Baseline

要約 GAN はトレーニングが難しいという主張が広く広まっており、文献中の GA … 続きを読む

カテゴリー: cs.CV, cs.LG | The GAN is dead; long live the GAN! A Modern GAN Baseline はコメントを受け付けていません

Progressive Growing of Video Tokenizers for Highly Compressed Latent Spaces

要約 ビデオ トークナイザーは潜在ビデオ拡散モデルに不可欠であり、生のビデオ デ … 続きを読む

カテゴリー: cs.AI, cs.CV | Progressive Growing of Video Tokenizers for Highly Compressed Latent Spaces はコメントを受け付けていません