-
最近の投稿
- Enhancing Efficiency in Multidevice Federated Learning through Data Selection
- RadarTrack: Enhancing Ego-Vehicle Speed Estimation with Single-chip mmWave Radar
- HOPE: A Reinforcement Learning-based Hybrid Policy Path Planner for Diverse Parking Scenarios
- From Imitation to Exploration: End-to-end Autonomous Driving based on World Model
- LLM-Enabled In-Context Learning for Data Collection Scheduling in UAV-assisted Sensor Networks
-
最近のコメント
表示できるコメントはありません。 cs.AI (36903) cs.CL (27936) cs.CV (42678) cs.HC (2822) cs.LG (41843) cs.RO (21845) cs.SY (3324) eess.IV (4979) eess.SY (3316) stat.ML (5475)
「cs.CV」カテゴリーアーカイブ
Shape-Guided Clothing Warping for Virtual Try-On
要約 画像ベースのVirtual Try-Onは、ポーズの一貫性を維持しながら、 … 続きを読む
SuoiAI: Building a Dataset for Aquatic Invertebrates in Vietnam
要約 生態学的健康と保全の取り組みにとって、水生生物多様性の理解と監視が重要です … 続きを読む
Bringing Diversity from Diffusion Models to Semantic-Guided Face Asset Generation
要約 デジタルモデリングと人間の顔の再構築は、さまざまなアプリケーションに役立ち … 続きを読む
Revealing the 3D Cosmic Web through Gravitationally Constrained Neural Fields
要約 弱い重力レンズは、主に宇宙の暗黒物質の重力効果によって引き起こされる銀河形 … 続きを読む
カテゴリー: astro-ph.CO, cs.CV
コメントする
Diffusion Bridge Models for 3D Medical Image Translation
要約 拡散テンソルイメージング(DTI)は、人間の脳の微細構造に関する重要な洞察 … 続きを読む
An LMM for Efficient Video Understanding via Reinforced Compression of Video Cubes
要約 大規模なマルチモーダルモデル(LMM)は、ビデオフレームを均一に知覚し、本 … 続きを読む
Eagle 2.5: Boosting Long-Context Post-Training for Frontier Vision-Language Models
要約 長いコンテキストマルチモーダル学習のために、フロンティアビジョンモデル(V … 続きを読む
ICE: Intrinsic Concept Extraction from a Single Image via Diffusion Models
要約 視覚概念を定義する際の固有のあいまいさは、単一の画像から概念を正確に学習す … 続きを読む
DRAWER: Digital Reconstruction and Articulation With Environment Realism
要約 現実世界のデータから仮想デジタルレプリカを作成すると、ゲームやロボット工学 … 続きを読む
Seeing from Another Perspective: Evaluating Multi-View Understanding in MLLMs
要約 マルチビューの理解、効果的なナビゲーション、操作、3Dシーンの理解のために … 続きを読む