cs.CV」カテゴリーアーカイブ

Generalized Diffusion Detector: Mining Robust Features from Diffusion Models for Domain-Generalized Detection

要約 オブジェクト検出のドメイン一般化(DG)は、目に見えないシナリオでの検出器 … 続きを読む

カテゴリー: cs.CV | コメントする

Image Editing As Programs with Diffusion Models

要約 拡散モデルはテキストからイメージの生成で顕著な成功を収めていますが、命令主 … 続きを読む

カテゴリー: cs.CV | コメントする

DualMap: Online Open-Vocabulary Semantic Mapping for Natural Language Navigation in Dynamic Changing Scenes

要約 ロボットが自然言語のクエリを通じて動的に変化する環境を理解し、ナビゲートで … 続きを読む

カテゴリー: cs.CV, cs.RO | コメントする

Estimating Total Lung Volume from Pixel-level Thickness Maps of Chest Radiographs Using Deep Learning

要約 目的:U-Net Deep Learning Modelによって生成された … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | コメントする

Single-Pass Object-Focused Data Selection

要約 しばしば豊富な画像データは豊富にありますが、高品質のラベルのコストは重要な … 続きを読む

カテゴリー: cs.CV | コメントする

Bézier Splatting for Fast and Differentiable Vector Graphics Rendering

要約 微分可能なベクトルグラフィックス(VG)は画像ベクトル化とベクトル合成で広 … 続きを読む

カテゴリー: cs.CV, cs.GR | コメントする

FlexGS: Train Once, Deploy Everywhere with Many-in-One Flexible 3D Gaussian Splatting

要約 3Dガウス・スプラッティング(3DGS)は、その効率的なレンダリング能力に … 続きを読む

カテゴリー: cs.CV | コメントする

Right Side Up? Disentangling Orientation Understanding in MLLMs with Fine-grained Multi-axis Perception Tasks

要約 オブジェクトオリエンテーションの理解は、ロボット操作や拡張現実などのアプリ … 続きを読む

カテゴリー: cs.CV | コメントする

A Survey on (M)LLM-Based GUI Agents

要約 グラフィカルユーザーインターフェイス(GUI)エージェントは、ルールベース … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.HC | コメントする

Advancing Multimodal Reasoning: From Optimized Cold Start to Staged Reinforcement Learning

要約 複雑なテキストタスクにおけるDeepSeek-R1の顕著な推論能力に触発さ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントする