I.2.10」カテゴリーアーカイブ

AUTHENTICATION: Identifying Rare Failure Modes in Autonomous Vehicle Perception Systems using Adversarially Guided Diffusion Models

要約 自律車両(AVS)は、人工知能(AI)に依存して、オブジェクトを正確に検出 … 続きを読む

カテゴリー: 68T05, 68T45, cs.AI, cs.CV, cs.LG, cs.RO, I.2.10 | コメントする

A Guide to Structureless Visual Localization

要約 視覚ローカリゼーションアルゴリズム、つまり、既知のシーンでクエリ画像のカメ … 続きを読む

カテゴリー: cs.CV, I.2.10 | コメントする

jina-clip-v2: Multilingual Multimodal Embeddings for Text and Images

要約 対照的な言語イメージ前削除(CLIP)は、クロスモーダル情報の検索およびマ … 続きを読む

カテゴリー: 68T50, cs.CL, cs.CV, cs.IR, I.2.10 | コメントする

SLAM-Based Navigation and Fault Resilience in a Surveillance Quadcopter with Embedded Vision Systems

要約 GPSに依存しないナビゲーション用の視覚的スラム、動的安定性のための高度な … 続きを読む

カテゴリー: 68T40, 68U10, 70Q05, cs.CV, cs.RO, cs.SY, eess.SY, I.2.10 | コメントする

Representation Learning via Non-Contrastive Mutual Information

要約 ラベル付けデータは多くの場合、非常に時間がかかり、高価であるため、ほとんど … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, I.2.10, stat.ML | コメントする

A Novel Adaptive Hybrid Focal-Entropy Loss for Enhancing Diabetic Retinopathy Detection Using Convolutional Neural Networks

要約 糖尿病性網膜症は、世界中の失明の主な原因であり、AIベースの正確な診断ツー … 続きを読む

カテゴリー: 68T07, 68U10, 92C55, cs.AI, cs.CV, cs.LG, eess.IV, I.2.10 | コメントする

FocusedAD: Character-centric Movie Audio Description

要約 映画オーディオの説明(AD)は、対話のないセグメント中に視覚的なコンテンツ … 続きを読む

カテゴリー: cs.CV, I.2.10 | コメントする

ADAT: Time-Series-Aware Adaptive Transformer Architecture for Sign Language Translation

要約 現在の手話機械の翻訳システムは、標識をテキストに変換するために、手の動き、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, I.2.10 | コメントする

RSTeller: Scaling Up Visual Language Modeling in Remote Sensing with Rich Linguistic Semantics from Openly Available Data and Large Language Models

要約 リモートセンシングにおける豊富でよく目立たないマルチモーダルデータは、複雑 … 続きを読む

カテゴリー: cs.AI, cs.CV, I.2.10 | コメントする

FocusedAD: Character-centric Movie Audio Description

要約 映画オーディオの説明(AD)は、対話のないセグメント中に視覚的なコンテンツ … 続きを読む

カテゴリー: cs.CV, I.2.10 | コメントする