-
最近の投稿
- PhysNav-DG: A Novel Adaptive Framework for Robust VLM-Sensor Fusion in Navigation Applications
- Accelerating Diffusion Large Language Models with SlowFast Sampling: The Three Golden Principles
- IQE-CLIP: Instance-aware Query Embedding for Zero-/Few-shot Anomaly Detection in Medical Domain
- MMMG: A Massive, Multidisciplinary, Multi-Tier Generation Benchmark for Text-to-Image Reasoning
- Adaptive Discretization against an Adversary: Lipschitz bandits, Dynamic Pricing, and Auction Tuning
-
最近のコメント
表示できるコメントはありません。 cs.AI (39607) cs.CL (29982) cs.CV (44948) cs.HC (3015) cs.LG (44544) cs.RO (23690) cs.SY (3609) eess.IV (5149) eess.SY (3601) stat.ML (5788)
月別アーカイブ: 2024年5月
MetaToken: Detecting Hallucination in Image Descriptions by Meta Classification
要約 Large Vision Language Model (LVLM) は、 … 続きを読む
LOGO: Video Text Spotting with Language Collaboration and Glyph Perception Model
要約 ビデオ テキスト スポッティングは、ビデオ内のテキスト インスタンスのロー … 続きを読む
カテゴリー: cs.CV
LOGO: Video Text Spotting with Language Collaboration and Glyph Perception Model はコメントを受け付けていません
Going beyond compositional generalization, DDPMs can produce zero-shot interpolation
要約 ノイズ除去拡散確率モデル (DDPM) は画像生成において顕著な機能を示し … 続きを読む
$E^{3}$Gen: Efficient, Expressive and Editable Avatars Generation
要約 このペーパーは、効率的で表現力豊かで編集可能なデジタル アバターを生成する … 続きを読む
カテゴリー: cs.CV
$E^{3}$Gen: Efficient, Expressive and Editable Avatars Generation はコメントを受け付けていません
Contrastive-Adversarial and Diffusion: Exploring pre-training and fine-tuning strategies for sulcal identification
要約 過去 10 年間、コンピューター ビジョンでは、さまざまなトレーニングと学 … 続きを読む
VideoTree: Adaptive Tree-based Video Representation for LLM Reasoning on Long Videos
要約 ビデオ言語を理解するタスクは短いビデオ クリップに焦点を当てており、多くの … 続きを読む
REBEL: Reinforcement Learning via Regressing Relative Rewards
要約 近接ポリシー最適化 (PPO) は、もともと連続制御問題のために開発されま … 続きを読む
Intelligent Anomaly Detection for Lane Rendering Using Transformer with Self-Supervised Pre-Training and Customized Fine-Tuning
要約 デジタル地図を使用したナビゲーション サービスの急増は、ドライバーに大きな … 続きを読む
Towards Global Glacier Mapping with Deep Learning and Open Earth Observation Data
要約 地球規模の氷河の正確なマッピングは、気候変動の影響を理解するために不可欠で … 続きを読む
A study on the adequacy of common IQA measures for medical images
要約 画質評価 (IQA) は、画像を操作する新しい機械学習アルゴリズムの開発段 … 続きを読む