cs.AI」カテゴリーアーカイブ

Autoregressive Image Diffusion: Generation of Image Sequence and Application in MRI

要約 磁気共鳴画像法 (MRI) は、広く使用されている非侵襲性画像診断法です。 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | Autoregressive Image Diffusion: Generation of Image Sequence and Application in MRI はコメントを受け付けていません

TTT-Unet: Enhancing U-Net with Test-Time Training Layers for biomedical image segmentation

要約 生物医学画像のセグメンテーションは、さまざまな病気を正確に診断および分析す … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | TTT-Unet: Enhancing U-Net with Test-Time Training Layers for biomedical image segmentation はコメントを受け付けていません

MSDNet: Multi-Scale Decoder for Few-Shot Semantic Segmentation via Transformer-Guided Prototyping

要約 フューショット セマンティック セグメンテーションは、少数の注釈付きサンプ … 続きを読む

カテゴリー: cs.AI, cs.CV | MSDNet: Multi-Scale Decoder for Few-Shot Semantic Segmentation via Transformer-Guided Prototyping はコメントを受け付けていません

OmniGen: Unified Image Generation

要約 この研究では、統合画像生成のための新しい普及モデルである OmniGen … 続きを読む

カテゴリー: cs.AI, cs.CV | OmniGen: Unified Image Generation はコメントを受け付けていません

RenderWorld: World Model with Self-Supervised 3D Label

要約 ビジョンのみによるエンドツーエンドの自動運転は、LiDAR とビジョンの融 … 続きを読む

カテゴリー: cs.AI, cs.CV | RenderWorld: World Model with Self-Supervised 3D Label はコメントを受け付けていません

Multi-OCT-SelfNet: Integrating Self-Supervised Learning with Multi-Source Data Fusion for Enhanced Multi-Class Retinal Disease Classification

要約 医療分野では、プライバシー上の懸念により、大規模なデータセットを取得するこ … 続きを読む

カテゴリー: cs.AI, cs.CV | Multi-OCT-SelfNet: Integrating Self-Supervised Learning with Multi-Source Data Fusion for Enhanced Multi-Class Retinal Disease Classification はコメントを受け付けていません

NVLM: Open Frontier-Class Multimodal LLMs

要約 NVLM 1.0 は、視覚言語タスクで最先端の結果を達成するフロンティアク … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | NVLM: Open Frontier-Class Multimodal LLMs はコメントを受け付けていません

Flash STU: Fast Spectral Transform Units

要約 このペーパーでは、スペクトル変換ユニットの効率的なオープンソース PyTo … 続きを読む

カテゴリー: cs.AI, cs.LG | Flash STU: Fast Spectral Transform Units はコメントを受け付けていません

jina-embeddings-v3: Multilingual Embeddings With Task LoRA

要約 jina-embeddings-v3 は、5 億 7,000 万のパラメー … 続きを読む

カテゴリー: 68T50, cs.AI, cs.CL, cs.IR, I.2.7 | jina-embeddings-v3: Multilingual Embeddings With Task LoRA はコメントを受け付けていません

Augmenting Automatic Speech Recognition Models with Disfluency Detection

要約 発話の流暢さは、会話や自発的な発話でよく発生します。 ただし、標準の自動音 … 続きを読む

カテゴリー: cs.AI, cs.CL | Augmenting Automatic Speech Recognition Models with Disfluency Detection はコメントを受け付けていません