cs.CV」カテゴリーアーカイブ

Event-based vision for egomotion estimation using precise event timing

要約 エゴモーション推定は、正確かつリアルタイムのモーション追跡が必要な自律ナビ … 続きを読む

カテゴリー: cs.AR, cs.CV, cs.RO | Event-based vision for egomotion estimation using precise event timing はコメントを受け付けていません

GenEx: Generating an Explorable World

要約 3D の物理的な現実世界を理解し、ナビゲートし、探索することは、長い間、人 … 続きを読む

カテゴリー: cs.CV, cs.RO | GenEx: Generating an Explorable World はコメントを受け付けていません

Transformer-Based Model for Monocular Visual Odometry: A Video Understanding Approach

要約 単一のカメラからの画像からカメラの姿勢を推定することは、移動ロボットや自律 … 続きを読む

カテゴリー: 68T07, 68T45, cs.AI, cs.CV, cs.RO | Transformer-Based Model for Monocular Visual Odometry: A Video Understanding Approach はコメントを受け付けていません

DCPI-Depth: Explicitly Infusing Dense Correspondence Prior to Unsupervised Monocular Depth Estimation

要約 最近、教師なしの方法で単眼ビデオから奥行きを知覚する方法を学ぶことへの関心 … 続きを読む

カテゴリー: cs.CV, cs.RO | DCPI-Depth: Explicitly Infusing Dense Correspondence Prior to Unsupervised Monocular Depth Estimation はコメントを受け付けていません

Towards autonomous photogrammetric forest inventory using a lightweight under-canopy robotic drone

要約 林業では、高解像度のリモートセンシングデータを取得するためにドローンの使用 … 続きを読む

カテゴリー: cs.CV, cs.RO | Towards autonomous photogrammetric forest inventory using a lightweight under-canopy robotic drone はコメントを受け付けていません

A margin-based replacement for cross-entropy loss

要約 クロスエントロピー (CE) 損失は、ディープ ニューラル ネットワークを … 続きを読む

カテゴリー: cs.CV, cs.LG | A margin-based replacement for cross-entropy loss はコメントを受け付けていません

FLAME: Learning to Navigate with Multimodal LLM in Urban Environments

要約 大規模言語モデル (LLM) は、視覚と言語のナビゲーション (VLN) … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.RO | FLAME: Learning to Navigate with Multimodal LLM in Urban Environments はコメントを受け付けていません

Evolver: Chain-of-Evolution Prompting to Boost Large Multimodal Models for Hateful Meme Detection

要約 最近の進歩により、2 つのストリームのアプローチが憎悪ミームの検出において … 続きを読む

カテゴリー: cs.CL, cs.CV | Evolver: Chain-of-Evolution Prompting to Boost Large Multimodal Models for Hateful Meme Detection はコメントを受け付けていません

Survey on Hand Gesture Recognition from Visual Input

要約 手話認識、仮想現実および拡張現実、ロボット工学などの分野における人間とコン … 続きを読む

カテゴリー: cs.AI, cs.CV | Survey on Hand Gesture Recognition from Visual Input はコメントを受け付けていません

Adaptive Class Learning to Screen Diabetic Disorders in Fundus Images of Eye

要約 眼疾患の有病率は世界的に増加しており、公衆衛生上の大きな課題となっています … 続きを読む

カテゴリー: cs.AI, cs.CV | Adaptive Class Learning to Screen Diabetic Disorders in Fundus Images of Eye はコメントを受け付けていません