月別アーカイブ: 2025年4月

Joint Optimization of Neural Radiance Fields and Continuous Camera Motion from a Monocular Video

要約 ニューラル放射輝度フィールド(NERF)は、3Dジオメトリを表現する優れた … 続きを読む

カテゴリー: cs.CV | Joint Optimization of Neural Radiance Fields and Continuous Camera Motion from a Monocular Video はコメントを受け付けていません

Mjölnir: A Deep Learning Parametrization Framework for Global Lightning Flash Density

要約 FourcastNet、Pangu-Weather、Graphcastなど … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, physics.ao-ph | Mjölnir: A Deep Learning Parametrization Framework for Global Lightning Flash Density はコメントを受け付けていません

Taming the Randomness: Towards Label-Preserving Cropping in Contrastive Learning

要約 対照学習(CL)アプローチは、自己教師学習(SSL)方法の非常に成功したサ … 続きを読む

カテゴリー: cs.CV | Taming the Randomness: Towards Label-Preserving Cropping in Contrastive Learning はコメントを受け付けていません

HOIGaze: Gaze Estimation During Hand-Object Interactions in Extended Reality Exploiting Eye-Hand-Head Coordination

要約 Hoigazeを提示します – 拡張現実(XR)におけるハンド … 続きを読む

カテゴリー: cs.CV | HOIGaze: Gaze Estimation During Hand-Object Interactions in Extended Reality Exploiting Eye-Hand-Head Coordination はコメントを受け付けていません

AnimateAnywhere: Rouse the Background in Human Image Animation

要約 Human Image Animationは、目的のポーズシーケンスを順守 … 続きを読む

カテゴリー: cs.CV | AnimateAnywhere: Rouse the Background in Human Image Animation はコメントを受け付けていません

SRMF: A Data Augmentation and Multimodal Fusion Approach for Long-Tail UHR Satellite Image Segmentation

要約 ロングテールの問題は、超高解像度(UHR)衛星画像におけるセマンティックセ … 続きを読む

カテゴリー: cs.CV | SRMF: A Data Augmentation and Multimodal Fusion Approach for Long-Tail UHR Satellite Image Segmentation はコメントを受け付けていません

Foundation Model-Driven Framework for Human-Object Interaction Prediction with Segmentation Mask Integration

要約 この作業では、セグメンテーションベースのビジョンファンデーションモデルと従 … 続きを読む

カテゴリー: cs.AI, cs.CV | Foundation Model-Driven Framework for Human-Object Interaction Prediction with Segmentation Mask Integration はコメントを受け付けていません

DD-rPPGNet: De-interfering and Descriptive Feature Learning for Unsupervised rPPG Estimation

要約 リモートフォトプレチスモグラフィ(RPPG)は、フェイシャルビデオの生理学 … 続きを読む

カテゴリー: cs.CV | DD-rPPGNet: De-interfering and Descriptive Feature Learning for Unsupervised rPPG Estimation はコメントを受け付けていません

NORA: A Small Open-Sourced Generalist Vision Language Action Model for Embodied Tasks

要約 既存の視覚言語アクション(VLA)モデルは、ゼロショットシナリオで有望なパ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | NORA: A Small Open-Sourced Generalist Vision Language Action Model for Embodied Tasks はコメントを受け付けていません

CoherenDream: Boosting Holistic Text Coherence in 3D Generation via Multimodal Large Language Models Feedback

要約 スコア蒸留サンプリング(SDS)は、テキストから3Dのコンテンツ生成で顕著 … 続きを読む

カテゴリー: cs.CV | CoherenDream: Boosting Holistic Text Coherence in 3D Generation via Multimodal Large Language Models Feedback はコメントを受け付けていません