「cs.CV」カテゴリーアーカイブ

Mobile Robot Navigation Using Hand-Drawn Maps: A Vision Language Model Approach

投稿日: 2025年4月30日作成者: jarxiv

要約手描きのマップを使用して、自然で効率的な方法で人間とロボットの間のナビゲー … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

SOLAQUA: SINTEF Ocean Large Aquaculture Robotics Dataset

投稿日: 2025年4月30日作成者: jarxiv

要約このホワイトペーパーでは、海底の水産養殖環境で水中ロボットで収集されたデー … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Improving trajectory continuity in drone-based crowd monitoring using a set of minimal-cost techniques and deep discriminative correlation filters

投稿日: 2025年4月30日作成者: jarxiv

要約ドローンベースの群衆監視は、監視、公共の安全、イベント管理におけるアプリケ … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

DRO: Doppler-Aware Direct Radar Odometry

投稿日: 2025年4月30日作成者: jarxiv

要約モバイルロボットアプリケーション向けのレーダーベースのセンシングのルネッサ … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

GSFeatLoc: Visual Localization Using Feature Correspondence on 3D Gaussian Splatting

投稿日: 2025年4月30日作成者: jarxiv

要約このホワイトペーパーでは、事前計算された3Dガウススプラッティング（3DG … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Hydra: Marker-Free RGB-D Hand-Eye Calibration

投稿日: 2025年4月30日作成者: jarxiv

要約この作業は、嘘の代数に堅牢なポイントツープレーン（PTP）対物レンズを備え … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Kaleidoscope: In-language Exams for Massively Multilingual Vision Evaluation

投稿日: 2025年4月30日作成者: jarxiv

要約ビジョン言語モデル（VLMS）の評価は、主に英語のベンチマークに依存してお … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Pose-Based Sign Language Appearance Transfer

投稿日: 2025年4月30日作成者: jarxiv

要約サインコンテンツを保存しながら、手話の骨格ポーズで署名者の外観を転送する方 … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

The Best of Both Worlds: Integrating Language Models and Diffusion Models for Video Generation

投稿日: 2025年4月30日作成者: jarxiv

要約テキストからビデオへの最近の進歩（T2V）の生成は、自己回帰言語モデルと拡 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Predicate Debiasing in Vision-Language Models Integration for Scene Graph Generation Enhancement

投稿日: 2025年4月30日作成者: jarxiv

要約シーングラフ生成（SGG）は、視覚的なシーンの基本的な言語表現を提供し、モ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Mobile Robot Navigation Using Hand-Drawn Maps: A Vision Language Model Approach

SOLAQUA: SINTEF Ocean Large Aquaculture Robotics Dataset

Improving trajectory continuity in drone-based crowd monitoring using a set of minimal-cost techniques and deep discriminative correlation filters

DRO: Doppler-Aware Direct Radar Odometry

GSFeatLoc: Visual Localization Using Feature Correspondence on 3D Gaussian Splatting

Hydra: Marker-Free RGB-D Hand-Eye Calibration

Kaleidoscope: In-language Exams for Massively Multilingual Vision Evaluation

Pose-Based Sign Language Appearance Transfer

The Best of Both Worlds: Integrating Language Models and Diffusion Models for Video Generation

Predicate Debiasing in Vision-Language Models Integration for Scene Graph Generation Enhancement

最近の投稿

最近のコメント

アーカイブ

カテゴリー