-
最近の投稿
- Cross-lingual, Character-Level Neural Morphological Tagging
- A Systematic Approach to Design Real-World Human-in-the-Loop Deep Reinforcement Learning: Salient Features, Challenges and Trade-offs
- Robo-Troj: Attacking LLM-based Task Planners
- SE(3)-Equivariant Robot Learning and Control: A Tutorial Survey
- Geometric Formulation of Unified Force-Impedance Control on SE(3) for Robotic Manipulators
-
最近のコメント
表示できるコメントはありません。 cs.AI (37106) cs.CL (28088) cs.CV (42847) cs.HC (2837) cs.LG (42044) cs.RO (21987) cs.SY (3355) eess.IV (4990) eess.SY (3347) stat.ML (5498)
「I.2.10」カテゴリーアーカイブ
AUTHENTICATION: Identifying Rare Failure Modes in Autonomous Vehicle Perception Systems using Adversarially Guided Diffusion Models
要約 自律車両(AVS)は、人工知能(AI)に依存して、オブジェクトを正確に検出 … 続きを読む
A Guide to Structureless Visual Localization
要約 視覚ローカリゼーションアルゴリズム、つまり、既知のシーンでクエリ画像のカメ … 続きを読む
jina-clip-v2: Multilingual Multimodal Embeddings for Text and Images
要約 対照的な言語イメージ前削除(CLIP)は、クロスモーダル情報の検索およびマ … 続きを読む
SLAM-Based Navigation and Fault Resilience in a Surveillance Quadcopter with Embedded Vision Systems
要約 GPSに依存しないナビゲーション用の視覚的スラム、動的安定性のための高度な … 続きを読む
Representation Learning via Non-Contrastive Mutual Information
要約 ラベル付けデータは多くの場合、非常に時間がかかり、高価であるため、ほとんど … 続きを読む
A Novel Adaptive Hybrid Focal-Entropy Loss for Enhancing Diabetic Retinopathy Detection Using Convolutional Neural Networks
要約 糖尿病性網膜症は、世界中の失明の主な原因であり、AIベースの正確な診断ツー … 続きを読む
FocusedAD: Character-centric Movie Audio Description
要約 映画オーディオの説明(AD)は、対話のないセグメント中に視覚的なコンテンツ … 続きを読む
ADAT: Time-Series-Aware Adaptive Transformer Architecture for Sign Language Translation
要約 現在の手話機械の翻訳システムは、標識をテキストに変換するために、手の動き、 … 続きを読む
RSTeller: Scaling Up Visual Language Modeling in Remote Sensing with Rich Linguistic Semantics from Openly Available Data and Large Language Models
要約 リモートセンシングにおける豊富でよく目立たないマルチモーダルデータは、複雑 … 続きを読む
FocusedAD: Character-centric Movie Audio Description
要約 映画オーディオの説明(AD)は、対話のないセグメント中に視覚的なコンテンツ … 続きを読む