cs.CV」カテゴリーアーカイブ

Mobile Robot Navigation Using Hand-Drawn Maps: A Vision Language Model Approach

要約 手描きのマップを使用して、自然で効率的な方法で人間とロボットの間のナビゲー … 続きを読む

カテゴリー: cs.CV, cs.RO | Mobile Robot Navigation Using Hand-Drawn Maps: A Vision Language Model Approach はコメントを受け付けていません

SOLAQUA: SINTEF Ocean Large Aquaculture Robotics Dataset

要約 このホワイトペーパーでは、海底の水産養殖環境で水中ロボットで収集されたデー … 続きを読む

カテゴリー: cs.CV, cs.RO | SOLAQUA: SINTEF Ocean Large Aquaculture Robotics Dataset はコメントを受け付けていません

Improving trajectory continuity in drone-based crowd monitoring using a set of minimal-cost techniques and deep discriminative correlation filters

要約 ドローンベースの群衆監視は、監視、公共の安全、イベント管理におけるアプリケ … 続きを読む

カテゴリー: cs.CV, cs.RO | Improving trajectory continuity in drone-based crowd monitoring using a set of minimal-cost techniques and deep discriminative correlation filters はコメントを受け付けていません

DRO: Doppler-Aware Direct Radar Odometry

要約 モバイルロボットアプリケーション向けのレーダーベースのセンシングのルネッサ … 続きを読む

カテゴリー: cs.CV, cs.RO | DRO: Doppler-Aware Direct Radar Odometry はコメントを受け付けていません

GSFeatLoc: Visual Localization Using Feature Correspondence on 3D Gaussian Splatting

要約 このホワイトペーパーでは、事前計算された3Dガウススプラッティング(3DG … 続きを読む

カテゴリー: cs.CV, cs.RO | GSFeatLoc: Visual Localization Using Feature Correspondence on 3D Gaussian Splatting はコメントを受け付けていません

Hydra: Marker-Free RGB-D Hand-Eye Calibration

要約 この作業は、嘘の代数に堅牢なポイントツープレーン(PTP)対物レンズを備え … 続きを読む

カテゴリー: cs.CV, cs.RO | Hydra: Marker-Free RGB-D Hand-Eye Calibration はコメントを受け付けていません

Kaleidoscope: In-language Exams for Massively Multilingual Vision Evaluation

要約 ビジョン言語モデル(VLMS)の評価は、主に英語のベンチマークに依存してお … 続きを読む

カテゴリー: cs.CL, cs.CV | Kaleidoscope: In-language Exams for Massively Multilingual Vision Evaluation はコメントを受け付けていません

Pose-Based Sign Language Appearance Transfer

要約 サインコンテンツを保存しながら、手話の骨格ポーズで署名者の外観を転送する方 … 続きを読む

カテゴリー: cs.CL, cs.CV | Pose-Based Sign Language Appearance Transfer はコメントを受け付けていません

The Best of Both Worlds: Integrating Language Models and Diffusion Models for Video Generation

要約 テキストからビデオへの最近の進歩(T2V)の生成は、自己回帰言語モデルと拡 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | The Best of Both Worlds: Integrating Language Models and Diffusion Models for Video Generation はコメントを受け付けていません

Predicate Debiasing in Vision-Language Models Integration for Scene Graph Generation Enhancement

要約 シーングラフ生成(SGG)は、視覚的なシーンの基本的な言語表現を提供し、モ … 続きを読む

カテゴリー: cs.CV | Predicate Debiasing in Vision-Language Models Integration for Scene Graph Generation Enhancement はコメントを受け付けていません