「cs.CV」カテゴリーアーカイブ

Event-based vision for egomotion estimation using precise event timing

投稿日: 2025年1月22日作成者: jarxiv

要約エゴモーション推定は、正確かつリアルタイムのモーション追跡が必要な自律ナビ … 続きを読む →

カテゴリー: cs.AR, cs.CV, cs.RO | コメントを受け付けていません

GenEx: Generating an Explorable World

投稿日: 2025年1月22日作成者: jarxiv

要約 3D の物理的な現実世界を理解し、ナビゲートし、探索することは、長い間、人 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Transformer-Based Model for Monocular Visual Odometry: A Video Understanding Approach

投稿日: 2025年1月22日作成者: jarxiv

要約単一のカメラからの画像からカメラの姿勢を推定することは、移動ロボットや自律 … 続きを読む →

カテゴリー: 68T07, 68T45, cs.AI, cs.CV, cs.RO | コメントを受け付けていません

DCPI-Depth: Explicitly Infusing Dense Correspondence Prior to Unsupervised Monocular Depth Estimation

投稿日: 2025年1月22日作成者: jarxiv

要約最近、教師なしの方法で単眼ビデオから奥行きを知覚する方法を学ぶことへの関心 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Towards autonomous photogrammetric forest inventory using a lightweight under-canopy robotic drone

投稿日: 2025年1月22日作成者: jarxiv

要約林業では、高解像度のリモートセンシングデータを取得するためにドローンの使用 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

A margin-based replacement for cross-entropy loss

投稿日: 2025年1月22日作成者: jarxiv

要約クロスエントロピー (CE) 損失は、ディープニューラルネットワークを … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

FLAME: Learning to Navigate with Multimodal LLM in Urban Environments

投稿日: 2025年1月22日作成者: jarxiv

要約大規模言語モデル (LLM) は、視覚と言語のナビゲーション (VLN) … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.RO | コメントを受け付けていません

Evolver: Chain-of-Evolution Prompting to Boost Large Multimodal Models for Hateful Meme Detection

投稿日: 2025年1月22日作成者: jarxiv

要約最近の進歩により、2 つのストリームのアプローチが憎悪ミームの検出において … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Survey on Hand Gesture Recognition from Visual Input

投稿日: 2025年1月22日作成者: jarxiv

要約手話認識、仮想現実および拡張現実、ロボット工学などの分野における人間とコン … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Adaptive Class Learning to Screen Diabetic Disorders in Fundus Images of Eye

投稿日: 2025年1月22日作成者: jarxiv

要約眼疾患の有病率は世界的に増加しており、公衆衛生上の大きな課題となっています … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Event-based vision for egomotion estimation using precise event timing

GenEx: Generating an Explorable World

Transformer-Based Model for Monocular Visual Odometry: A Video Understanding Approach

DCPI-Depth: Explicitly Infusing Dense Correspondence Prior to Unsupervised Monocular Depth Estimation

Towards autonomous photogrammetric forest inventory using a lightweight under-canopy robotic drone

A margin-based replacement for cross-entropy loss

FLAME: Learning to Navigate with Multimodal LLM in Urban Environments

Evolver: Chain-of-Evolution Prompting to Boost Large Multimodal Models for Hateful Meme Detection

Survey on Hand Gesture Recognition from Visual Input

Adaptive Class Learning to Screen Diabetic Disorders in Fundus Images of Eye

最近の投稿

最近のコメント

アーカイブ

カテゴリー