-
最近の投稿
- Toward Zero-Shot User Intent Recognition in Shared Autonomy
- SYNAPSE: SYmbolic Neural-Aided Preference Synthesis Engine
- Resilient Distributed Optimization for Multi-Agent Cyberphysical Systems
- Beyond Sight: Finetuning Generalist Robot Policies with Heterogeneous Sensors via Language Grounding
- A Signal Temporal Logic Approach for Task-Based Coordination of Multi-Aerial Systems: a Wind Turbine Inspection Case Study
-
最近のコメント
表示できるコメントはありません。 cs.AI (32314) cs.CL (24433) cs.CR (2508) cs.CV (38542) cs.LG (37190) cs.RO (18852) cs.SY (2881) eess.IV (4623) eess.SY (2875) stat.ML (4911)
月別アーカイブ: 2024年7月
Dilated Strip Attention Network for Image Restoration
要約 画像の復元は、劣化した画像から潜在的な鮮明な画像を回復しようとする長年の課 … 続きを読む
Similarity Distance-Based Label Assignment for Tiny Object Detection
要約 小さなオブジェクトの検出は、オブジェクトのサイズが限られていて情報が不足し … 続きを読む
カテゴリー: cs.CV
Similarity Distance-Based Label Assignment for Tiny Object Detection はコメントを受け付けていません
LookupForensics: A Large-Scale Multi-Task Dataset for Multi-Phase Image-Based Fact Verification
要約 偽造画像の急増、特にディープフェイクコンテンツの津波の中で、偽造技術の継続 … 続きを読む
MOoSE: Multi-Orientation Sharing Experts for Open-set Scene Text Recognition
要約 新しい文字と以前に見た文字の両方に対処することを目的としたオープンセット … 続きを読む
カテゴリー: cs.CV
MOoSE: Multi-Orientation Sharing Experts for Open-set Scene Text Recognition はコメントを受け付けていません
Every Part Matters: Integrity Verification of Scientific Figures Based on Multimodal Large Language Models
要約 この論文は、科学的数値の解釈における重要な問題、つまりテキストと図のきめ細 … 続きを読む
Geometric Generative Models based on Morphological Equivariant PDEs and GANs
要約 コンテンツと画像の生成は、テクスチャ、エッジ、その他の薄い画像構造などの特 … 続きを読む
DynamicTrack: Advancing Gigapixel Tracking in Crowded Scenes
要約 ギガピクセル シナリオでの追跡には、ビデオ監視や歩行者分析において多くの潜 … 続きを読む
カテゴリー: cs.CV
DynamicTrack: Advancing Gigapixel Tracking in Crowded Scenes はコメントを受け付けていません
Model Composition for Multimodal Large Language Models
要約 マルチモーダル大規模言語モデル (MLLM) の最近の開発は急速な進歩を示 … 続きを読む
Auto DragGAN: Editing the Generative Image Manifold in an Autoregressive Manner
要約 ピクセルレベルのきめの細かい画像編集は依然として未解決の課題です。 以前の … 続きを読む
カテゴリー: cs.CV
Auto DragGAN: Editing the Generative Image Manifold in an Autoregressive Manner はコメントを受け付けていません
Adversarial Robustification via Text-to-Image Diffusion Models
要約 敵対的堅牢性は、ニューラル ネットワークのエンコードが困難な特性であり、大 … 続きを読む