月別アーカイブ: 2024年2月

ScreenAI: A Vision-Language Model for UI and Infographics Understanding

要約 画面ユーザー インターフェイス (UI) とインフォグラフィックスは、同様 … 続きを読む

カテゴリー: cs.AI, cs.CV | ScreenAI: A Vision-Language Model for UI and Infographics Understanding はコメントを受け付けていません

DriveVLM: The Convergence of Autonomous Driving and Large Vision-Language Models

要約 都市環境における自動運転の主なハードルは、困難な道路状況や繊細な人間の行動 … 続きを読む

カテゴリー: cs.CV | DriveVLM: The Convergence of Autonomous Driving and Large Vision-Language Models はコメントを受け付けていません

Regularization by denoising: Bayesian model and Langevin-within-split Gibbs sampling

要約 この論文では、ノイズ除去による正則化 (RED) パラダイムに確率論的に対 … 続きを読む

カテゴリー: cs.CV, cs.LG, stat.ML | Regularization by denoising: Bayesian model and Langevin-within-split Gibbs sampling はコメントを受け付けていません

UncertaintyTrack: Exploiting Detection and Localization Uncertainty in Multi-Object Tracking

要約 研究コミュニティからの強い関心と物体検出方法の着実な改善により、最近、複数 … 続きを読む

カテゴリー: cs.CV, cs.RO | UncertaintyTrack: Exploiting Detection and Localization Uncertainty in Multi-Object Tracking はコメントを受け付けていません

Landmark Stereo Dataset for Landmark Recognition and Moving Node Localization in a Non-GPS Battlefield Environment

要約 この論文では、無線ベースのアンカー ノードの代わりにランドマーク アンカー … 続きを読む

カテゴリー: cs.CV, cs.LG | Landmark Stereo Dataset for Landmark Recognition and Moving Node Localization in a Non-GPS Battlefield Environment はコメントを受け付けていません

RaTrack: Moving Object Detection and Tracking with 4D Radar Point Cloud

要約 モバイルの自律性は、動的な環境を正確に認識することに依存しています。 した … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | RaTrack: Moving Object Detection and Tracking with 4D Radar Point Cloud はコメントを受け付けていません

Robust CLIP: Unsupervised Adversarial Fine-Tuning of Vision Embeddings for Robust Large Vision-Language Models

要約 OpenFlamingo、LLaVA、GPT-4 などのマルチモーダル基盤 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, stat.ML | Robust CLIP: Unsupervised Adversarial Fine-Tuning of Vision Embeddings for Robust Large Vision-Language Models はコメントを受け付けていません

FiT: Flexible Vision Transformer for Diffusion Model

要約 自然は無限に解像度がありません。 この現実を踏まえると、拡散トランスフォー … 続きを読む

カテゴリー: cs.CV | FiT: Flexible Vision Transformer for Diffusion Model はコメントを受け付けていません

Binary Opacity Grids: Capturing Fine Geometric Detail for Mesh-Based View Synthesis

要約 サーフェスベースのビュー合成アルゴリズムは、計算要件が低いため魅力的ですが … 続きを読む

カテゴリー: cs.CV | Binary Opacity Grids: Capturing Fine Geometric Detail for Mesh-Based View Synthesis はコメントを受け付けていません

Preferences Evolve And So Should Your Bandits: Bandits with Evolving States for Online Platforms

要約 我々は、決定論的に進化する状態と観察不可能な状態を考慮しながらバンディット … 続きを読む

カテゴリー: cs.AI, cs.GT, cs.LG | Preferences Evolve And So Should Your Bandits: Bandits with Evolving States for Online Platforms はコメントを受け付けていません