-
最近の投稿
- Enhancing Efficiency in Multidevice Federated Learning through Data Selection
- RadarTrack: Enhancing Ego-Vehicle Speed Estimation with Single-chip mmWave Radar
- HOPE: A Reinforcement Learning-based Hybrid Policy Path Planner for Diverse Parking Scenarios
- From Imitation to Exploration: End-to-end Autonomous Driving based on World Model
- LLM-Enabled In-Context Learning for Data Collection Scheduling in UAV-assisted Sensor Networks
-
最近のコメント
表示できるコメントはありません。 cs.AI (36903) cs.CL (27936) cs.CV (42678) cs.HC (2822) cs.LG (41843) cs.RO (21845) cs.SY (3324) eess.IV (4979) eess.SY (3316) stat.ML (5475)
月別アーカイブ: 2024年9月
InterNet: Unsupervised Cross-modal Homography Estimation Based on Interleaved Modality Transfer and Self-supervised Homography Prediction
要約 我々は、インターリーブモダリティ転送と自己教師付きホモグラフィー予測に基づ … 続きを読む
カテゴリー: cs.CV
InterNet: Unsupervised Cross-modal Homography Estimation Based on Interleaved Modality Transfer and Self-supervised Homography Prediction はコメントを受け付けていません
PhoCoLens: Photorealistic and Consistent Reconstruction in Lensless Imaging
要約 レンズレスカメラは、従来のレンズベースのシステムと比較して、サイズ、重量、 … 続きを読む
Disentangled Clothed Avatar Generation from Text Descriptions
要約 本稿では、人体と衣服を別々に生成し、生成されたアバター上で高品質なアニメー … 続きを読む
カテゴリー: cs.CV
Disentangled Clothed Avatar Generation from Text Descriptions はコメントを受け付けていません
Valeo4Cast: A Modular Approach to End-to-End Forecasting
要約 動き予測は、歩行者、車両、信号機などの周囲のエージェントの将来の軌道を予測 … 続きを読む
Synthesizing Environment-Specific People in Photographs
要約 我々は、入力写真に描かれたシーンに意味的に適切な服を着た人物のフォトリアリ … 続きを読む
カテゴリー: cs.CV
Synthesizing Environment-Specific People in Photographs はコメントを受け付けていません
Transferring disentangled representations: bridging the gap between synthetic and real images
要約 データ生成メカニズムの基本構造を分離する、意味のある効率的な表現を開発する … 続きを読む
ReliOcc: Towards Reliable Semantic Occupancy Prediction via Uncertainty Learning
要約 視覚中心のセマンティック占有予測は自動運転において重要な役割を果たしており … 続きを読む
Exploring Event-based Human Pose Estimation with 3D Event Representations
要約 人間の姿勢推定は、コンピューター ビジョンにおける基本的かつ魅力的なタスク … 続きを読む
EMOVA: Empowering Language Models to See, Hear and Speak with Vivid Emotions
要約 GPT-4o は、多様な感情やトーンの音声会話を可能にするオムニモーダル … 続きを読む