-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年1月
4D-CS: Exploiting Cluster Prior for 4D Spatio-Temporal LiDAR Semantic Segmentation
要約 LiDAR ポイントのセマンティック セグメンテーションは、自動運転システ … 続きを読む
カテゴリー: cs.CV
4D-CS: Exploiting Cluster Prior for 4D Spatio-Temporal LiDAR Semantic Segmentation はコメントを受け付けていません
MotionBench: Benchmarking and Improving Fine-grained Video Motion Understanding for Vision Language Models
要約 近年、ビジョン言語モデル (VLM) により、ビデオの理解が大幅に進歩しま … 続きを読む
カテゴリー: cs.CV
MotionBench: Benchmarking and Improving Fine-grained Video Motion Understanding for Vision Language Models はコメントを受け付けていません
Driving by the Rules: A Benchmark for Integrating Traffic Sign Regulations into Vectorized HD Map
要約 交通標識の規制を順守することは、人間と自律車両の両方のナビゲーションにとっ … 続きを読む
SceneVTG++: Controllable Multilingual Visual Text Generation in the Wild
要約 自然風景の画像内にビジュアル テキストを生成することは、多くの未解決の問題 … 続きを読む
カテゴリー: cs.CV
SceneVTG++: Controllable Multilingual Visual Text Generation in the Wild はコメントを受け付けていません
Socratic Questioning: Learn to Self-guide Multimodal Reasoning in the Wild
要約 複雑な視覚的推論は、今日でも重要な課題です。 通常、この課題には、思考連鎖 … 続きを読む
Human Gaze Boosts Object-Centered Representation Learning
要約 人間のような自己中心的な視覚入力でトレーニングされた最近の自己教師あり学習 … 続きを読む
HaWoR: World-Space Hand Motion Reconstruction from Egocentric Videos
要約 3D 手の姿勢推定の出現にもかかわらず、現在の方法は主にカメラ フレーム内 … 続きを読む
カテゴリー: cs.CV
HaWoR: World-Space Hand Motion Reconstruction from Egocentric Videos はコメントを受け付けていません
STAR: Spatial-Temporal Augmentation with Text-to-Video Models for Real-World Video Super-Resolution
要約 画像拡散モデルは、GAN ベースの手法における過度の平滑化の問題に対処する … 続きを読む
カテゴリー: cs.CV
STAR: Spatial-Temporal Augmentation with Text-to-Video Models for Real-World Video Super-Resolution はコメントを受け付けていません
A Novel Automatic Real-time Motion Tracking Method for Magnetic Resonance Imaging-guided Radiotherapy: Leveraging the Enhanced Tracking-Learning-Detection Framework with Automatic Segmentation
要約 背景と目的: MRI 誘導放射線治療 (MRIgRT) における正確な動作 … 続きを読む
カテゴリー: cs.CV, cs.LG, eess.IV, physics.med-ph, q-bio.TO
A Novel Automatic Real-time Motion Tracking Method for Magnetic Resonance Imaging-guided Radiotherapy: Leveraging the Enhanced Tracking-Learning-Detection Framework with Automatic Segmentation はコメントを受け付けていません
LEDiff: Latent Exposure Diffusion for HDR Generation
要約 消費者向けディスプレイでは 10 ストップを超えるダイナミック レンジのサ … 続きを読む