投稿者「jarxiv」のアーカイブ

Enhanced Encoder-Decoder Architecture for Accurate Monocular Depth Estimation

投稿日: 2025年1月24日作成者: jarxiv

要約単一の 2D 画像から奥行きを推定することは、通常、奥行き知覚に必要なステ … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

First Lessons Learned of an Artificial Intelligence Robotic System for Autonomous Coarse Waste Recycling Using Multispectral Imaging-Based Methods

投稿日: 2025年1月24日作成者: jarxiv

要約粗粒の廃棄物の現在の廃棄施設は、重機を備えた材料の手動ソートを実行します。 … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Dual-Modal Prototype Joint Learning for Compositional Zero-Shot Learning

投稿日: 2025年1月24日作成者: jarxiv

要約構成ゼロショット学習 (CZSL) は、見た構成から学習した知識を活用して … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Eye Gaze as a Signal for Conveying User Attention in Contextual AI Systems

投稿日: 2025年1月24日作成者: jarxiv

要約高度なマルチモーダル AI エージェントは、ユーザーと協力して世界の課題を … 続きを読む →

カテゴリー: cs.CV, cs.HC | コメントを受け付けていません

Multimodal Sensor Dataset for Monitoring Older Adults Post Lower-Limb Fractures in Community Settings

投稿日: 2025年1月24日作成者: jarxiv

要約下肢骨折（LLF）は高齢者にとって大きな健康上の懸念であり、多くの場合、可 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Generating Realistic Forehead-Creases for User Verification via Conditioned Piecewise Polynomial Curves

投稿日: 2025年1月24日作成者: jarxiv

要約 B-SplineおよびB \ ‘Ezier曲線を使用して、額を … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Pix2Cap-COCO: Advancing Visual Comprehension via Pixel-Level Captioning

投稿日: 2025年1月24日作成者: jarxiv

要約私たちは、きめ細かい視覚的理解を促進するために設計された初のパノプティック … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

GUI-Bee: Align GUI Action Grounding to Novel Environments via Autonomous Exploration

投稿日: 2025年1月24日作成者: jarxiv

要約グラフィカルユーザーインターフェイス (GUI) アクションのグラウン … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

PointOBB-v3: Expanding Performance Boundaries of Single Point-Supervised Oriented Object Detection

投稿日: 2025年1月24日作成者: jarxiv

要約指向性物体検出 (OOD) に対する需要の高まりに伴い、点教師あり OOD … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Binary Diffusion Probabilistic Model

投稿日: 2025年1月24日作成者: jarxiv

要約バイナリデータ表現に最適化された新しい生成モデルであるバイナリ拡散確率モ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

投稿者「jarxiv」のアーカイブ

Enhanced Encoder-Decoder Architecture for Accurate Monocular Depth Estimation

First Lessons Learned of an Artificial Intelligence Robotic System for Autonomous Coarse Waste Recycling Using Multispectral Imaging-Based Methods

Dual-Modal Prototype Joint Learning for Compositional Zero-Shot Learning

Eye Gaze as a Signal for Conveying User Attention in Contextual AI Systems

Multimodal Sensor Dataset for Monitoring Older Adults Post Lower-Limb Fractures in Community Settings

Generating Realistic Forehead-Creases for User Verification via Conditioned Piecewise Polynomial Curves

Pix2Cap-COCO: Advancing Visual Comprehension via Pixel-Level Captioning

GUI-Bee: Align GUI Action Grounding to Novel Environments via Autonomous Exploration

PointOBB-v3: Expanding Performance Boundaries of Single Point-Supervised Oriented Object Detection

Binary Diffusion Probabilistic Model

最近の投稿

最近のコメント

アーカイブ

カテゴリー