-
最近の投稿
- Human-Robot Dialogue Annotation for Multi-Modal Common Ground
- Anticipatory Planning for Performant Long-Lived Robot in Large-Scale Home-Like Environments
- SCOUT: A Situated and Multi-Modal Human-Robot Dialogue Corpus
- Next Best Sense: Guiding Vision and Touch with FisherRF for 3D Gaussian Splatting
- ForestAlign: Automatic Forest Structure-based Alignment for Multi-view TLS and ALS Point Clouds
-
最近のコメント
表示できるコメントはありません。 cs.AI (29925) cs.CL (22599) cs.CR (2321) cs.CV (36300) cs.LG (34746) cs.RO (17366) cs.SY (2670) eess.IV (4416) eess.SY (2664) stat.ML (4635)
「I.4」カテゴリーアーカイブ
Solving the inverse problem of microscopy deconvolution with a residual Beylkin-Coifman-Rokhlin neural network
要約 光学顕微鏡(LM)における光学デコンボリューションとは、画像から対象物の詳 … 続きを読む
Full-Scale Indexing and Semantic Annotation of CT Imaging: Boosting FAIRness
要約 背景: 人工知能の医療への統合により、特に診断と治療計画において大きな進歩 … 続きを読む
M3LEO: A Multi-Modal, Multi-Label Earth Observation Dataset Integrating Interferometric SAR and RGB Data
要約 衛星ベースのリモート センシングは、急速に進化する世界で地球規模の課題に対 … 続きを読む
MetaToken: Detecting Hallucination in Image Descriptions by Meta Classification
要約 Large Vision Language Model (LVLM) は、 … 続きを読む
Designing A Sustainable Marine Debris Clean-up Framework without Human Labels
要約 海洋ゴミは、鳥、魚、その他の動物に重大な生態学的脅威をもたらします。 がれ … 続きを読む
Deep Blur Multi-Model (DeepBlurMM) — a strategy to mitigate the impact of image blur on deep learning model performance in histopathology image analysis
要約 病理組織全体のスライド画像 (WSI) の AI ベースの分析は、コンピュ … 続きを読む
Multi-resolution Rescored ByteTrack for Video Object Detection on Ultra-low-power Embedded Systems
要約 このペーパーでは、超低電力組み込みプロセッサ用の新しいビデオ オブジェクト … 続きを読む
UVDoc: Neural Grid-based Document Unwarping
要約 曲がったりしわになったページの何気ない写真から、印刷された文書の元の平らな … 続きを読む
Outline-Guided Object Inpainting with Diffusion Models
要約 インスタンス セグメンテーション データセットは、正確で堅牢なコンピュータ … 続きを読む