-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Mobile Robot Navigation Using Hand-Drawn Maps: A Vision Language Model Approach
要約 手描きのマップを使用して、自然で効率的な方法で人間とロボットの間のナビゲー … 続きを読む
SOLAQUA: SINTEF Ocean Large Aquaculture Robotics Dataset
要約 このホワイトペーパーでは、海底の水産養殖環境で水中ロボットで収集されたデー … 続きを読む
Improving trajectory continuity in drone-based crowd monitoring using a set of minimal-cost techniques and deep discriminative correlation filters
要約 ドローンベースの群衆監視は、監視、公共の安全、イベント管理におけるアプリケ … 続きを読む
DRO: Doppler-Aware Direct Radar Odometry
要約 モバイルロボットアプリケーション向けのレーダーベースのセンシングのルネッサ … 続きを読む
GSFeatLoc: Visual Localization Using Feature Correspondence on 3D Gaussian Splatting
要約 このホワイトペーパーでは、事前計算された3Dガウススプラッティング(3DG … 続きを読む
Hydra: Marker-Free RGB-D Hand-Eye Calibration
要約 この作業は、嘘の代数に堅牢なポイントツープレーン(PTP)対物レンズを備え … 続きを読む
Kaleidoscope: In-language Exams for Massively Multilingual Vision Evaluation
要約 ビジョン言語モデル(VLMS)の評価は、主に英語のベンチマークに依存してお … 続きを読む
Pose-Based Sign Language Appearance Transfer
要約 サインコンテンツを保存しながら、手話の骨格ポーズで署名者の外観を転送する方 … 続きを読む
The Best of Both Worlds: Integrating Language Models and Diffusion Models for Video Generation
要約 テキストからビデオへの最近の進歩(T2V)の生成は、自己回帰言語モデルと拡 … 続きを読む
Predicate Debiasing in Vision-Language Models Integration for Scene Graph Generation Enhancement
要約 シーングラフ生成(SGG)は、視覚的なシーンの基本的な言語表現を提供し、モ … 続きを読む
カテゴリー: cs.CV
Predicate Debiasing in Vision-Language Models Integration for Scene Graph Generation Enhancement はコメントを受け付けていません