-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Material Anything: Generating Materials for Any 3D Object via Diffusion
要約 私たちは、3D オブジェクト用の物理ベースのマテリアルを生成するように設計 … 続きを読む
DiffusionDrive: Truncated Diffusion Model for End-to-End Autonomous Driving
要約 最近、拡散モデルはロボットによる政策学習のための強力な生成技術として登場し … 続きを読む
Adversarial Poisoning Attack on Quantum Machine Learning Models
要約 量子機械学習 (QML) への関心が高まり、クラウド プロバイダーを通じて … 続きを読む
Image Compression Using Novel View Synthesis Priors
要約 リアルタイムの視覚フィードバックは、特に検査や操作作業中に、遠隔操作車両の … 続きを読む
OTO Planner: An Efficient Only Travelling Once Exploration Planner for Complex and Unknown Environments
要約 複雑で乱雑な環境における自律探索は、さまざまなアプリケーションにとって不可 … 続きを読む
t-READi: Transformer-Powered Robust and Efficient Multimodal Inference for Autonomous Driving
要約 自動運転車 (AV) によるマルチモーダル センサー (カメラ、ライダー、 … 続きを読む
Exosense: A Vision-Based Scene Understanding System For Exoskeletons
要約 自己平衡外骨格は、運動障害のある人にとって重要な技術です。 現在の課題は人 … 続きを読む
MMGenBench: Evaluating the Limits of LMMs from the Text-to-Image Generation Perspective
要約 大規模マルチモーダル モデル (LMM) は、顕著な機能を実証しています。 … 続きを読む
Is Less More? Exploring Token Condensation as Training-free Adaptation for CLIP
要約 対照言語画像事前トレーニング (CLIP) は、画像分類において顕著な汎化 … 続きを読む
Visual Contexts Clarify Ambiguous Expressions: A Benchmark Dataset
要約 現実世界のシナリオでモデルが人間と効果的に対話するには、マルチモーダルな入 … 続きを読む