月別アーカイブ: 2025年1月

A Novel Pathology Foundation Model by Mayo Clinic, Charité, and Aignostics

投稿日: 2025年1月10日作成者: jarxiv

要約デジタルパソロジーの最近の進歩により、さまざまなアプリケーションにわたる基 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Seeing Sound: Assembling Sounds from Visuals for Audio-to-Image Generation

投稿日: 2025年1月10日作成者: jarxiv

要約音声から画像への生成モデルをトレーニングするには、意味的に整合した多様な音 … 続きを読む →

カテゴリー: cs.CV, cs.SD, eess.AS | コメントを受け付けていません

From Images to Insights: Transforming Brain Cancer Diagnosis with Explainable AI

投稿日: 2025年1月10日作成者: jarxiv

要約脳腫瘍は医療診断における大きな課題であり、効果的な治療には正確かつタイムリ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Zero-1-to-G: Taming Pretrained 2D Diffusion Model for Direct 3D Generation

投稿日: 2025年1月10日作成者: jarxiv

要約 2D 画像生成の最近の進歩は、主に拡散モデルの能力と大規模なデータセットの … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Flatland Vision

投稿日: 2025年1月10日作成者: jarxiv

要約一対の投影面にある 2 組のラベル付き点を投影線上の同じ画像に投影できるの … 続きを読む →

カテゴリー: cs.CV, math.AG | コメントを受け付けていません

AgroGPT: Efficient Agricultural Vision-Language Model with Expert Tuning

投稿日: 2025年1月10日作成者: jarxiv

要約オンラインで入手可能な画像テキストデータの膨大なリポジトリを活用して、大 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Gradient-based facial encoding for key generation to encrypt and decrypt multimedia data

投稿日: 2025年1月10日作成者: jarxiv

要約パスワードに依存するセキュリティシステムは、忘れられたり、推測されたり、 … 続きを読む →

カテゴリー: cs.CR, cs.CV | コメントを受け付けていません

$DPF^*$: improved Depth Potential Function for scale-invariant sulcal depth estimation

投稿日: 2025年1月10日作成者: jarxiv

要約人間の脳の形状は複雑で非常に多様であり、脳の大きさ、皮質の折り畳み、年齢の … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

The GAN is dead; long live the GAN! A Modern GAN Baseline

投稿日: 2025年1月10日作成者: jarxiv

要約 GAN はトレーニングが難しいという主張が広く広まっており、文献中の GA … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Progressive Growing of Video Tokenizers for Highly Compressed Latent Spaces

投稿日: 2025年1月10日作成者: jarxiv

要約ビデオトークナイザーは潜在ビデオ拡散モデルに不可欠であり、生のビデオデ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

月別アーカイブ: 2025年1月

A Novel Pathology Foundation Model by Mayo Clinic, Charité, and Aignostics

Seeing Sound: Assembling Sounds from Visuals for Audio-to-Image Generation

From Images to Insights: Transforming Brain Cancer Diagnosis with Explainable AI

Zero-1-to-G: Taming Pretrained 2D Diffusion Model for Direct 3D Generation

Flatland Vision

AgroGPT: Efficient Agricultural Vision-Language Model with Expert Tuning

Gradient-based facial encoding for key generation to encrypt and decrypt multimedia data

$DPF^*$: improved Depth Potential Function for scale-invariant sulcal depth estimation

The GAN is dead; long live the GAN! A Modern GAN Baseline

Progressive Growing of Video Tokenizers for Highly Compressed Latent Spaces

最近の投稿

最近のコメント

アーカイブ

カテゴリー