cs.AI」カテゴリーアーカイブ

Multi-modal Vision Pre-training for Medical Image Analysis

要約 自己学習学習は、実際のアプリケーションのトレーニングデータ要件を抑制するこ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Multi-modal Vision Pre-training for Medical Image Analysis はコメントを受け付けていません

Alzheimer’s Disease Classification Using Retinal OCT: TransnetOCT and Swin Transformer Models

要約 網膜の光コヒーレンス断層撮影(OCT)画像は、有病率が上昇している神経変性 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | Alzheimer’s Disease Classification Using Retinal OCT: TransnetOCT and Swin Transformer Models はコメントを受け付けていません

HiTVideo: Hierarchical Tokenizers for Enhancing Text-to-Video Generation with Autoregressive Large Language Models

要約 テキストからビデオへの生成は、動画データの固有の複雑さにより、重大な課題を … 続きを読む

カテゴリー: cs.AI, cs.CV | HiTVideo: Hierarchical Tokenizers for Enhancing Text-to-Video Generation with Autoregressive Large Language Models はコメントを受け付けていません

AdaptGCD: Multi-Expert Adapter Tuning for Generalized Category Discovery

要約 密接な世界の仮定によって制約されている従来の半教師の学習パラダイムとは異な … 続きを読む

カテゴリー: cs.AI, cs.CV | AdaptGCD: Multi-Expert Adapter Tuning for Generalized Category Discovery はコメントを受け付けていません

FLASHμ: Fast Localizing And Sizing of Holographic Microparticles

要約 回折画像からの微粒子の3D位置とサイズの再構築 – ホログラム … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, physics.ao-ph, physics.optics | FLASHμ: Fast Localizing And Sizing of Holographic Microparticles はコメントを受け付けていません

RASA: Replace Anyone, Say Anything — A Training-Free Framework for Audio-Driven and Universal Portrait Video Editing

要約 ポートレートビデオ編集は、オーディオまたはビデオストリームに導かれた、ポー … 続きを読む

カテゴリー: cs.AI, cs.CV | RASA: Replace Anyone, Say Anything — A Training-Free Framework for Audio-Driven and Universal Portrait Video Editing はコメントを受け付けていません

Centaur: Robust End-to-End Autonomous Driving with Test-Time Training

要約 展開中にエンドツーエンドの自動運転車の複雑な意思決定システムにどのように依 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Centaur: Robust End-to-End Autonomous Driving with Test-Time Training はコメントを受け付けていません

PEMF-VTO: Point-Enhanced Video Virtual Try-on via Mask-free Paradigm

要約 Video Virtual Try-Onは、視覚的な忠実度と時間的一貫性の … 続きを読む

カテゴリー: cs.AI, cs.CV | PEMF-VTO: Point-Enhanced Video Virtual Try-on via Mask-free Paradigm はコメントを受け付けていません

dFLMoE: Decentralized Federated Learning via Mixture of Experts for Medical Data Analysis

要約 Federated Learningは、医療分野で幅広い用途を持っています … 続きを読む

カテゴリー: cs.AI, cs.LG | dFLMoE: Decentralized Federated Learning via Mixture of Experts for Medical Data Analysis はコメントを受け付けていません

Dual-Stage Cross-Modal Network with Dynamic Feature Fusion for Emotional Mimicry Intensity Estimation

要約 感情的な模倣強度(EMI)推定は、人間の社会的行動を理解し、人間とコンピュ … 続きを読む

カテゴリー: cs.AI, cs.CV | Dual-Stage Cross-Modal Network with Dynamic Feature Fusion for Emotional Mimicry Intensity Estimation はコメントを受け付けていません