投稿者「jarxiv」のアーカイブ

Enhanced Encoder-Decoder Architecture for Accurate Monocular Depth Estimation

要約 単一の 2D 画像から奥行きを推定することは、通常、奥行き知覚に必要なステ … 続きを読む

カテゴリー: cs.CV, eess.IV | Enhanced Encoder-Decoder Architecture for Accurate Monocular Depth Estimation はコメントを受け付けていません

First Lessons Learned of an Artificial Intelligence Robotic System for Autonomous Coarse Waste Recycling Using Multispectral Imaging-Based Methods

要約 粗粒の廃棄物の現在の廃棄施設は、重機を備えた材料の手動ソートを実行します。 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | First Lessons Learned of an Artificial Intelligence Robotic System for Autonomous Coarse Waste Recycling Using Multispectral Imaging-Based Methods はコメントを受け付けていません

Dual-Modal Prototype Joint Learning for Compositional Zero-Shot Learning

要約 構成ゼロショット学習 (CZSL) は、見た構成から学習した知識を活用して … 続きを読む

カテゴリー: cs.CV | Dual-Modal Prototype Joint Learning for Compositional Zero-Shot Learning はコメントを受け付けていません

Eye Gaze as a Signal for Conveying User Attention in Contextual AI Systems

要約 高度なマルチモーダル AI エージェントは、ユーザーと協力して世界の課題を … 続きを読む

カテゴリー: cs.CV, cs.HC | Eye Gaze as a Signal for Conveying User Attention in Contextual AI Systems はコメントを受け付けていません

Multimodal Sensor Dataset for Monitoring Older Adults Post Lower-Limb Fractures in Community Settings

要約 下肢骨折(LLF)は高齢者にとって大きな健康上の懸念であり、多くの場合、可 … 続きを読む

カテゴリー: cs.CV, cs.LG | Multimodal Sensor Dataset for Monitoring Older Adults Post Lower-Limb Fractures in Community Settings はコメントを受け付けていません

Generating Realistic Forehead-Creases for User Verification via Conditioned Piecewise Polynomial Curves

要約 B-SplineおよびB \ ‘Ezier曲線を使用して、額を … 続きを読む

カテゴリー: cs.CV | Generating Realistic Forehead-Creases for User Verification via Conditioned Piecewise Polynomial Curves はコメントを受け付けていません

Pix2Cap-COCO: Advancing Visual Comprehension via Pixel-Level Captioning

要約 私たちは、きめ細かい視覚的理解を促進するために設計された初のパノプティック … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Pix2Cap-COCO: Advancing Visual Comprehension via Pixel-Level Captioning はコメントを受け付けていません

GUI-Bee: Align GUI Action Grounding to Novel Environments via Autonomous Exploration

要約 グラフィカル ユーザー インターフェイス (GUI) アクションのグラウン … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | GUI-Bee: Align GUI Action Grounding to Novel Environments via Autonomous Exploration はコメントを受け付けていません

PointOBB-v3: Expanding Performance Boundaries of Single Point-Supervised Oriented Object Detection

要約 指向性物体検出 (OOD) に対する需要の高まりに伴い、点教師あり OOD … 続きを読む

カテゴリー: cs.AI, cs.CV | PointOBB-v3: Expanding Performance Boundaries of Single Point-Supervised Oriented Object Detection はコメントを受け付けていません

Binary Diffusion Probabilistic Model

要約 バイナリ データ表現に最適化された新しい生成モデルであるバイナリ拡散確率モ … 続きを読む

カテゴリー: cs.CV | Binary Diffusion Probabilistic Model はコメントを受け付けていません