-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Keypoint Abstraction using Large Models for Object-Relative Imitation Learning
要約 多様なタスクや環境にわたる新しいオブジェクト構成やインスタンスへの一般化は … 続きを読む
DisC-GS: Discontinuity-aware Gaussian Splatting
要約 最近、ガウス分布の集合として 3D シーンを表現する手法であるガウス スプ … 続きを読む
カテゴリー: cs.CV
DisC-GS: Discontinuity-aware Gaussian Splatting はコメントを受け付けていません
EMMA: End-to-End Multimodal Model for Autonomous Driving
要約 自動運転のためのエンドツーエンドのマルチモーダルモデルであるEMMAを紹介 … 続きを読む
Certified Robustness to Data Poisoning in Gradient-Based Training
要約 最新の機械学習パイプラインは大量の公開データを活用しているため、データの品 … 続きを読む
TOMATO: Assessing Visual Temporal Reasoning Capabilities in Multimodal Foundation Models
要約 既存のベンチマークでは、ビデオ理解のための時間的コンテキストを活用する際に … 続きを読む
Multi-student Diffusion Distillation for Better One-step Generators
要約 拡散モデルは、長時間にわたる複数ステップの推論手順を犠牲にして、高品質のサ … 続きを読む
SlowFast-VGen: Slow-Fast Learning for Action-Driven Long Video Generation
要約 人間には、一般的な世界の動きの遅い学習と、新しい経験からのエピソード記憶の … 続きを読む
OpenSatMap: A Fine-grained High-resolution Satellite Dataset for Large-scale Map Construction
要約 この論文では、大規模な地図構築のためのきめの細かい高解像度の衛星データセッ … 続きを読む
カテゴリー: cs.CV
OpenSatMap: A Fine-grained High-resolution Satellite Dataset for Large-scale Map Construction はコメントを受け付けていません
RelationBooth: Towards Relation-Aware Customized Object Generation
要約 カスタマイズされた画像の生成は、ユーザーが提供する画像プロンプトに基づいて … 続きを読む
カテゴリー: cs.CV
RelationBooth: Towards Relation-Aware Customized Object Generation はコメントを受け付けていません
ReferEverything: Towards Segmenting Everything We Can Speak of in Videos
要約 自然言語を通じて説明できるビデオ内の幅広い概念をセグメント化するためのフレ … 続きを読む
カテゴリー: cs.CV
ReferEverything: Towards Segmenting Everything We Can Speak of in Videos はコメントを受け付けていません