-
最近の投稿
- High-Dimensional Independence Testing via Maximum and Average Distance Correlations
- Online Adaptation of Terrain-Aware Dynamics for Planning in Unstructured Environments
- ‘Don’t Do That!’: Guiding Embodied Systems through Large Language Model-based Constraint Generation
- SGN-CIRL: Scene Graph-based Navigation with Curriculum, Imitation, and Reinforcement Learning
- Olfactory Inertial Odometry: Sensor Calibration and Drift Compensation
-
最近のコメント
表示できるコメントはありません。 cs.AI (39257) cs.CL (29715) cs.CV (44646) cs.HC (2989) cs.LG (44172) cs.RO (23444) cs.SY (3577) eess.IV (5131) eess.SY (3569) stat.ML (5744)
「cs.CV」カテゴリーアーカイブ
Language-Image Alignment with Fixed Text Encoders
要約 現在、言語と画像のアライメントを確立するための最も一般的なアプローチは、C … 続きを読む
Diffusion Domain Teacher: Diffusion Guided Domain Adaptive Object Detector
要約 物体検出器は、学習データ(ソースドメイン)と実世界データ(ターゲットドメイ … 続きを読む
FullDiT2: Efficient In-Context Conditioning for Video Diffusion Transformers
要約 ビデオ拡散変換器におけるきめ細かく効率的な制御可能性は、その適用性に対する … 続きを読む
Sounding that Object: Interactive Object-Aware Image to Audio Generation
要約 複雑なオーディオビジュアルシーンに対して正確なサウンドを生成することは、特 … 続きを読む
UNIC: Unified In-Context Video Editing
要約 テキストからビデオへの生成における最近の進歩は、生成的なビデオ編集タスクへ … 続きを読む
Pseudo-Simulation for Autonomous Driving
要約 自律走行車(AV)に対する既存の評価パラダイムは、決定的な限界に直面してい … 続きを読む
Struct2D: A Perception-Guided Framework for Spatial Reasoning in Large Multimodal Models
要約 大規模マルチモーダルモデル(LMM)における空間推論を解き明かすことは、3 … 続きを読む
Seeing in the Dark: Benchmarking Egocentric 3D Vision with the Oxford Day-and-Night Dataset
要約 オックスフォード・デイ・アンド・ナイト(Oxford Day-and-Ni … 続きを読む
Voyager: Long-Range and World-Consistent Video Diffusion for Explorable 3D Scene Generation
要約 ビデオゲームやバーチャルリアリティのような実世界のアプリケーションでは、ユ … 続きを読む