cs.AI」カテゴリーアーカイブ

GenHOI: Generalizing Text-driven 4D Human-Object Interaction Synthesis for Unseen Objects

要約 拡散モデルと大規模なモーションデータセットは、テキスト駆動型のヒトモーショ … 続きを読む

カテゴリー: cs.AI, cs.CV | GenHOI: Generalizing Text-driven 4D Human-Object Interaction Synthesis for Unseen Objects はコメントを受け付けていません

Pixel-level Certified Explanations via Randomized Smoothing

要約 事後帰属方法は、影響力のある入力ピクセルを強調することにより、深い学習予測 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Pixel-level Certified Explanations via Randomized Smoothing はコメントを受け付けていません

EgoBlind: Towards Egocentric Visual Assistance for the Blind

要約 視覚障害者から収集された最初のエゴセントリックビデオデータセットであるeg … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | EgoBlind: Towards Egocentric Visual Assistance for the Blind はコメントを受け付けていません

Exploring Personalized Federated Learning Architectures for Violence Detection in Surveillance Videos

要約 都市監視システムにおける暴力事件を検出するという課題は、ビデオデータの膨大 … 続きを読む

カテゴリー: cs.AI, cs.CV | Exploring Personalized Federated Learning Architectures for Violence Detection in Surveillance Videos はコメントを受け付けていません

CLAIM: Clinically-Guided LGE Augmentation for Realistic and Diverse Myocardial Scar Synthesis and Segmentation

要約 後期ガドリニウム増強(LGE)心臓MRIからの深い学習ベースの心筋瘢痕セグ … 続きを読む

カテゴリー: cs.AI, cs.CV | CLAIM: Clinically-Guided LGE Augmentation for Realistic and Diverse Myocardial Scar Synthesis and Segmentation はコメントを受け付けていません

TARDIS STRIDE: A Spatio-Temporal Road Image Dataset and World Model for Autonomy

要約 世界モデルは、環境をシミュレートし、効果的なエージェントの動作を可能にする … 続きを読む

カテゴリー: cs.AI, cs.CV | TARDIS STRIDE: A Spatio-Temporal Road Image Dataset and World Model for Autonomy はコメントを受け付けていません

One-Step Diffusion for Detail-Rich and Temporally Consistent Video Super-Resolution

要約 特に、現実的な詳細合成のために安定した拡散(SD)などの事前に訓練された生 … 続きを読む

カテゴリー: cs.AI, cs.CV | One-Step Diffusion for Detail-Rich and Temporally Consistent Video Super-Resolution はコメントを受け付けていません

Vision Transformers Don’t Need Trained Registers

要約 視覚変圧器における以前に特定された現象の根底にあるメカニズムを調査します。 … 続きを読む

カテゴリー: cs.AI, cs.CV | Vision Transformers Don’t Need Trained Registers はコメントを受け付けていません

Generalized Out-of-Distribution Detection and Beyond in Vision Language Model Era: A Survey

要約 分散分布(OOD)サンプルの検出は、機械学習システムの安全性を確保するため … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Generalized Out-of-Distribution Detection and Beyond in Vision Language Model Era: A Survey はコメントを受け付けていません

Demystifying the Visual Quality Paradox in Multimodal Large Language Models

要約 最近のマルチモーダル大手言語モデル(MLLM)は、ベンチマークビジョン言語 … 続きを読む

カテゴリー: cs.AI, cs.CV | Demystifying the Visual Quality Paradox in Multimodal Large Language Models はコメントを受け付けていません