-
最近の投稿
- Design of an End-effector with Application to Avocado Harvesting
- Active Human Pose Estimation via an Autonomous UAV Agent
- Equivariant Diffusion Policy
- Empathic Grounding: Explorations using Multimodal Interaction and Large Language Models with Conversational Agents
- LHManip: A Dataset for Long-Horizon Language-Grounded Manipulation Tasks in Cluttered Tabletop Environments
-
最近のコメント
表示できるコメントはありません。 cs.AI (23553) cs.CL (17693) cs.CR (1841) cs.CV (30612) cs.LG (28313) cs.RO (13198) cs.SY (2095) eess.IV (3775) eess.SY (2090) stat.ML (3894)
「I.4」カテゴリーアーカイブ
Full-Scale Indexing and Semantic Annotation of CT Imaging: Boosting FAIRness
要約 背景: 人工知能の医療への統合により、特に診断と治療計画において大きな進歩 … 続きを読む
M3LEO: A Multi-Modal, Multi-Label Earth Observation Dataset Integrating Interferometric SAR and RGB Data
要約 衛星ベースのリモート センシングは、急速に進化する世界で地球規模の課題に対 … 続きを読む
MetaToken: Detecting Hallucination in Image Descriptions by Meta Classification
要約 Large Vision Language Model (LVLM) は、 … 続きを読む
Designing A Sustainable Marine Debris Clean-up Framework without Human Labels
要約 海洋ゴミは、鳥、魚、その他の動物に重大な生態学的脅威をもたらします。 がれ … 続きを読む
Deep Blur Multi-Model (DeepBlurMM) — a strategy to mitigate the impact of image blur on deep learning model performance in histopathology image analysis
要約 病理組織全体のスライド画像 (WSI) の AI ベースの分析は、コンピュ … 続きを読む
Multi-resolution Rescored ByteTrack for Video Object Detection on Ultra-low-power Embedded Systems
要約 このペーパーでは、超低電力組み込みプロセッサ用の新しいビデオ オブジェクト … 続きを読む
UVDoc: Neural Grid-based Document Unwarping
要約 曲がったりしわになったページの何気ない写真から、印刷された文書の元の平らな … 続きを読む
Outline-Guided Object Inpainting with Diffusion Models
要約 インスタンス セグメンテーション データセットは、正確で堅牢なコンピュータ … 続きを読む
Latent space configuration for improved generalization in supervised autoencoder neural networks
要約 オートエンコーダー (AE) は、入力を低次元の潜在空間 (LS) に投影 … 続きを読む
FusionBooster: A Unified Image Fusion Boosting Paradigm
要約 近年、異なる視覚タスク間の避けられないギャップや計算負荷を無視して、画像融 … 続きを読む