「cs.AI」カテゴリーアーカイブ

Multi-modal Vision Pre-training for Medical Image Analysis

投稿日: 2025年3月17日作成者: jarxiv

要約自己学習学習は、実際のアプリケーションのトレーニングデータ要件を抑制するこ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Alzheimer’s Disease Classification Using Retinal OCT: TransnetOCT and Swin Transformer Models

投稿日: 2025年3月17日作成者: jarxiv

要約網膜の光コヒーレンス断層撮影（OCT）画像は、有病率が上昇している神経変性 … 続きを読む →

カテゴリー: cs.AI, cs.CV, eess.IV | コメントを受け付けていません

HiTVideo: Hierarchical Tokenizers for Enhancing Text-to-Video Generation with Autoregressive Large Language Models

投稿日: 2025年3月17日作成者: jarxiv

要約テキストからビデオへの生成は、動画データの固有の複雑さにより、重大な課題を … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

AdaptGCD: Multi-Expert Adapter Tuning for Generalized Category Discovery

投稿日: 2025年3月17日作成者: jarxiv

要約密接な世界の仮定によって制約されている従来の半教師の学習パラダイムとは異な … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

FLASHμ: Fast Localizing And Sizing of Holographic Microparticles

投稿日: 2025年3月17日作成者: jarxiv

要約回折画像からの微粒子の3D位置とサイズの再構築 – ホログラム … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, physics.ao-ph, physics.optics | コメントを受け付けていません

RASA: Replace Anyone, Say Anything — A Training-Free Framework for Audio-Driven and Universal Portrait Video Editing

投稿日: 2025年3月17日作成者: jarxiv

要約ポートレートビデオ編集は、オーディオまたはビデオストリームに導かれた、ポー … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Centaur: Robust End-to-End Autonomous Driving with Test-Time Training

投稿日: 2025年3月17日作成者: jarxiv

要約展開中にエンドツーエンドの自動運転車の複雑な意思決定システムにどのように依 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

PEMF-VTO: Point-Enhanced Video Virtual Try-on via Mask-free Paradigm

投稿日: 2025年3月17日作成者: jarxiv

要約 Video Virtual Try-Onは、視覚的な忠実度と時間的一貫性の … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

dFLMoE: Decentralized Federated Learning via Mixture of Experts for Medical Data Analysis

投稿日: 2025年3月17日作成者: jarxiv

要約 Federated Learningは、医療分野で幅広い用途を持っています … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Dual-Stage Cross-Modal Network with Dynamic Feature Fusion for Emotional Mimicry Intensity Estimation

投稿日: 2025年3月17日作成者: jarxiv

要約感情的な模倣強度（EMI）推定は、人間の社会的行動を理解し、人間とコンピュ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

Multi-modal Vision Pre-training for Medical Image Analysis

Alzheimer’s Disease Classification Using Retinal OCT: TransnetOCT and Swin Transformer Models

HiTVideo: Hierarchical Tokenizers for Enhancing Text-to-Video Generation with Autoregressive Large Language Models

AdaptGCD: Multi-Expert Adapter Tuning for Generalized Category Discovery

FLASHμ: Fast Localizing And Sizing of Holographic Microparticles

RASA: Replace Anyone, Say Anything — A Training-Free Framework for Audio-Driven and Universal Portrait Video Editing

Centaur: Robust End-to-End Autonomous Driving with Test-Time Training

PEMF-VTO: Point-Enhanced Video Virtual Try-on via Mask-free Paradigm

dFLMoE: Decentralized Federated Learning via Mixture of Experts for Medical Data Analysis

Dual-Stage Cross-Modal Network with Dynamic Feature Fusion for Emotional Mimicry Intensity Estimation

最近の投稿

最近のコメント

アーカイブ

カテゴリー