月別アーカイブ: 2025年4月

Real-time Free-view Human Rendering from Sparse-view RGB Videos using Double Unprojected Textures

要約 スパースビューRGB入力からのリアルタイムフリービューのヒューマンレンダリ … 続きを読む

カテゴリー: cs.CV | Real-time Free-view Human Rendering from Sparse-view RGB Videos using Double Unprojected Textures はコメントを受け付けていません

LMFormer: Lane based Motion Prediction Transformer

要約 モーション予測は、自律運転において重要な役割を果たします。 この研究では、 … 続きを読む

カテゴリー: cs.CV, cs.LG | LMFormer: Lane based Motion Prediction Transformer はコメントを受け付けていません

DiffMOD: Progressive Diffusion Point Denoising for Moving Object Detection in Remote Sensing

要約 リモートセンシングの移動オブジェクト検出(MOD)は、低解像度、非常に小さ … 続きを読む

カテゴリー: 68T10, cs.CV, I.4.8 | DiffMOD: Progressive Diffusion Point Denoising for Moving Object Detection in Remote Sensing はコメントを受け付けていません

Distilling Textual Priors from LLM to Efficient Image Fusion

要約 マルチモダリティ画像Fusionは、複数のソース入力からの単一の包括的な画 … 続きを読む

カテゴリー: cs.CV | Distilling Textual Priors from LLM to Efficient Image Fusion はコメントを受け付けていません

Zero-shot Autonomous Microscopy for Scalable and Intelligent Characterization of 2D Materials

要約 原子スケール材料の特性評価では、伝統的に、数ヶ月から長年の専門的なトレーニ … 続きを読む

カテゴリー: cond-mat.mes-hall, cond-mat.mtrl-sci, cs.AI, cs.CV, cs.LG | Zero-shot Autonomous Microscopy for Scalable and Intelligent Characterization of 2D Materials はコメントを受け付けていません

Multi-Level Embedding and Alignment Network with Consistency and Invariance Learning for Cross-View Geo-Localization

要約 Cross-View Geo-Localization(CVGL)には、最 … 続きを読む

カテゴリー: cs.CV | Multi-Level Embedding and Alignment Network with Consistency and Invariance Learning for Cross-View Geo-Localization はコメントを受け付けていません

Noise2Ghost: Self-supervised deep convolutional reconstruction for ghost imaging

要約 私たちは、監視されていない方法の中で騒々しい獲得のために比類のない再構築パ … 続きを読む

カテゴリー: cs.CV, cs.LG, physics.data-an | Noise2Ghost: Self-supervised deep convolutional reconstruction for ghost imaging はコメントを受け付けていません

VLM-R1: A Stable and Generalizable R1-style Large Vision-Language Model

要約 最近、Deepseek R1は、補強学習(RL)が、シンプルで効果的なデザ … 続きを読む

カテゴリー: cs.CL, cs.CV | VLM-R1: A Stable and Generalizable R1-style Large Vision-Language Model はコメントを受け付けていません

ESCT3D: Efficient and Selectively Controllable Text-Driven 3D Content Generation with Gaussian Splatting

要約 近年、テキスト駆動型の3Dコンテンツ生成において、大きな進歩がなされていま … 続きを読む

カテゴリー: cs.CV | ESCT3D: Efficient and Selectively Controllable Text-Driven 3D Content Generation with Gaussian Splatting はコメントを受け付けていません

Analysis of Attention in Video Diffusion Transformers

要約 ビデオ拡散トランス(VDIT)で注意の詳細な分析を実施し、多くの新しい発見 … 続きを読む

カテゴリー: cs.CV | Analysis of Attention in Video Diffusion Transformers はコメントを受け付けていません