月別アーカイブ: 2025年4月

PicoPose: Progressive Pixel-to-Pixel Correspondence Learning for Novel Object Pose Estimation

要約 RGB画像からの新しいオブジェクトのポーズ推定は、ゼロショット汎化において … 続きを読む

カテゴリー: cs.CV | PicoPose: Progressive Pixel-to-Pixel Correspondence Learning for Novel Object Pose Estimation はコメントを受け付けていません

Efficient Model Editing with Task-Localized Sparse Fine-tuning

要約 タスク演算は、タスク固有の知識を合成可能なタスクベクトルとして表現すること … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Efficient Model Editing with Task-Localized Sparse Fine-tuning はコメントを受け付けていません

Enforcing View-Consistency in Class-Agnostic 3D Segmentation Fields

要約 ラディアンスフィールドは、複数の画像から3Dシーンをモデリングするための強 … 続きを読む

カテゴリー: cs.CV, cs.GR | Enforcing View-Consistency in Class-Agnostic 3D Segmentation Fields はコメントを受け付けていません

Towards Computation- and Communication-efficient Computational Pathology

要約 現在の計算病理学モデルは、広範な用途で優れた性能を発揮しているにもかかわら … 続きを読む

カテゴリー: cs.CV, eess.IV | Towards Computation- and Communication-efficient Computational Pathology はコメントを受け付けていません

Adaptive Frequency Enhancement Network for Remote Sensing Image Semantic Segmentation

要約 高解像度リモートセンシング画像の意味的セグメンテーションは、土地利用モニタ … 続きを読む

カテゴリー: cs.CV, eess.IV | Adaptive Frequency Enhancement Network for Remote Sensing Image Semantic Segmentation はコメントを受け付けていません

ViCaS: A Dataset for Combining Holistic and Pixel-level Video Understanding using Captions with Grounded Segmentation

要約 最近のマルチモーダル大規模言語モデル(MLLM)の進歩により、ビデオ理解に … 続きを読む

カテゴリー: cs.CV | ViCaS: A Dataset for Combining Holistic and Pixel-level Video Understanding using Captions with Grounded Segmentation はコメントを受け付けていません

A GAN-Enhanced Deep Learning Framework for Rooftop Detection from Historical Aerial Imagery

要約 歴史的な航空写真から屋根を正確に検出することは、長期的な都市開発と人間の居 … 続きを読む

カテゴリー: cs.CV | A GAN-Enhanced Deep Learning Framework for Rooftop Detection from Historical Aerial Imagery はコメントを受け付けていません

Understanding Depth and Height Perception in Large Visual-Language Models

要約 奥行きや高さの知覚を含む幾何学的理解は、知能の基本であり、環境をナビゲート … 続きを読む

カテゴリー: cs.CV | Understanding Depth and Height Perception in Large Visual-Language Models はコメントを受け付けていません

BECAME: BayEsian Continual Learning with Adaptive Model MErging

要約 継続的学習(CL)は、破滅的な忘却を軽減しながら、タスク間で段階的に学習す … 続きを読む

カテゴリー: cs.CV, cs.LG | BECAME: BayEsian Continual Learning with Adaptive Model MErging はコメントを受け付けていません

TokenHSI: Unified Synthesis of Physical Human-Scene Interactions through Task Tokenization

要約 多様で物理的にもっともらしい人間とシーンのインタラクション(HSI)を合成 … 続きを読む

カテゴリー: cs.CV | TokenHSI: Unified Synthesis of Physical Human-Scene Interactions through Task Tokenization はコメントを受け付けていません