-
最近の投稿
- Cosmos-Transfer1: Conditional World Generation with Adaptive Multimodal Control
- VizFlyt: Perception-centric Pedagogical Framework For Autonomous Aerial Robots
- Emotion estimation from video footage with LSTM
- FUSION: Frequency-guided Underwater Spatial Image recOnstructioN
- Plan-and-Act using Large Language Models for Interactive Agreement
-
最近のコメント
表示できるコメントはありません。 cs.AI (36042) cs.CL (27267) cs.CR (2746) cs.CV (41886) cs.LG (41010) cs.RO (21266) cs.SY (3212) eess.IV (4914) eess.SY (3206) stat.ML (5374)
「I.4」カテゴリーアーカイブ
M3LEO: A Multi-Modal, Multi-Label Earth Observation Dataset Integrating Interferometric SAR and RGB Data
要約 衛星ベースのリモート センシングは、急速に進化する世界で地球規模の課題に対 … 続きを読む
MetaToken: Detecting Hallucination in Image Descriptions by Meta Classification
要約 Large Vision Language Model (LVLM) は、 … 続きを読む
Designing A Sustainable Marine Debris Clean-up Framework without Human Labels
要約 海洋ゴミは、鳥、魚、その他の動物に重大な生態学的脅威をもたらします。 がれ … 続きを読む
Deep Blur Multi-Model (DeepBlurMM) — a strategy to mitigate the impact of image blur on deep learning model performance in histopathology image analysis
要約 病理組織全体のスライド画像 (WSI) の AI ベースの分析は、コンピュ … 続きを読む
Multi-resolution Rescored ByteTrack for Video Object Detection on Ultra-low-power Embedded Systems
要約 このペーパーでは、超低電力組み込みプロセッサ用の新しいビデオ オブジェクト … 続きを読む
UVDoc: Neural Grid-based Document Unwarping
要約 曲がったりしわになったページの何気ない写真から、印刷された文書の元の平らな … 続きを読む
Outline-Guided Object Inpainting with Diffusion Models
要約 インスタンス セグメンテーション データセットは、正確で堅牢なコンピュータ … 続きを読む
Latent space configuration for improved generalization in supervised autoencoder neural networks
要約 オートエンコーダー (AE) は、入力を低次元の潜在空間 (LS) に投影 … 続きを読む
FusionBooster: A Unified Image Fusion Boosting Paradigm
要約 近年、異なる視覚タスク間の避けられないギャップや計算負荷を無視して、画像融 … 続きを読む
DatUS^2: Data-driven Unsupervised Semantic Segmentation with Pre-trained Self-supervised Vision Transformer
要約 いくつかの自己教師付きトレーニング スキームの提案が次々と発表され、普遍的 … 続きを読む