-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年4月
PicoPose: Progressive Pixel-to-Pixel Correspondence Learning for Novel Object Pose Estimation
要約 RGB画像からの新しいオブジェクトのポーズ推定は、ゼロショット汎化において … 続きを読む
カテゴリー: cs.CV
PicoPose: Progressive Pixel-to-Pixel Correspondence Learning for Novel Object Pose Estimation はコメントを受け付けていません
Efficient Model Editing with Task-Localized Sparse Fine-tuning
要約 タスク演算は、タスク固有の知識を合成可能なタスクベクトルとして表現すること … 続きを読む
Enforcing View-Consistency in Class-Agnostic 3D Segmentation Fields
要約 ラディアンスフィールドは、複数の画像から3Dシーンをモデリングするための強 … 続きを読む
Towards Computation- and Communication-efficient Computational Pathology
要約 現在の計算病理学モデルは、広範な用途で優れた性能を発揮しているにもかかわら … 続きを読む
Adaptive Frequency Enhancement Network for Remote Sensing Image Semantic Segmentation
要約 高解像度リモートセンシング画像の意味的セグメンテーションは、土地利用モニタ … 続きを読む
ViCaS: A Dataset for Combining Holistic and Pixel-level Video Understanding using Captions with Grounded Segmentation
要約 最近のマルチモーダル大規模言語モデル(MLLM)の進歩により、ビデオ理解に … 続きを読む
カテゴリー: cs.CV
ViCaS: A Dataset for Combining Holistic and Pixel-level Video Understanding using Captions with Grounded Segmentation はコメントを受け付けていません
A GAN-Enhanced Deep Learning Framework for Rooftop Detection from Historical Aerial Imagery
要約 歴史的な航空写真から屋根を正確に検出することは、長期的な都市開発と人間の居 … 続きを読む
カテゴリー: cs.CV
A GAN-Enhanced Deep Learning Framework for Rooftop Detection from Historical Aerial Imagery はコメントを受け付けていません
Understanding Depth and Height Perception in Large Visual-Language Models
要約 奥行きや高さの知覚を含む幾何学的理解は、知能の基本であり、環境をナビゲート … 続きを読む
カテゴリー: cs.CV
Understanding Depth and Height Perception in Large Visual-Language Models はコメントを受け付けていません
BECAME: BayEsian Continual Learning with Adaptive Model MErging
要約 継続的学習(CL)は、破滅的な忘却を軽減しながら、タスク間で段階的に学習す … 続きを読む
TokenHSI: Unified Synthesis of Physical Human-Scene Interactions through Task Tokenization
要約 多様で物理的にもっともらしい人間とシーンのインタラクション(HSI)を合成 … 続きを読む
カテゴリー: cs.CV
TokenHSI: Unified Synthesis of Physical Human-Scene Interactions through Task Tokenization はコメントを受け付けていません