月別アーカイブ: 2024年3月

Click to Grasp: Zero-Shot Precise Manipulation via Visual Diffusion Descriptors

要約 ロボット工学においては、シーンやオブジェクト全体で一般化できる正確な操作が … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Click to Grasp: Zero-Shot Precise Manipulation via Visual Diffusion Descriptors はコメントを受け付けていません

Chain-of-Spot: Interactive Reasoning Improves Large Vision-Language Models

要約 視覚言語理解の領域では、視覚コンテンツの解釈と推論におけるモデルの熟練度が … 続きを読む

カテゴリー: cs.CV | Chain-of-Spot: Interactive Reasoning Improves Large Vision-Language Models はコメントを受け付けていません

HAC: Hash-grid Assisted Context for 3D Gaussian Splatting Compression

要約 3D ガウス スプラッティング (3DGS) は、高い忠実度で高速なレンダ … 続きを読む

カテゴリー: cs.CV | HAC: Hash-grid Assisted Context for 3D Gaussian Splatting Compression はコメントを受け付けていません

Transfer Learning for Cross-dataset Isolated Sign Language Recognition in Under-Resourced Datasets

要約 手話認識 (SLR) は、大規模な注釈付き手話データセットでトレーニングさ … 続きを読む

カテゴリー: cs.CV | Transfer Learning for Cross-dataset Isolated Sign Language Recognition in Under-Resourced Datasets はコメントを受け付けていません

Generalizing deep learning models for medical image classification

要約 多数の深層学習 (DL) モデルが広範な医用画像分析アプリケーション向けに … 続きを読む

カテゴリー: cs.CV, eess.IV | Generalizing deep learning models for medical image classification はコメントを受け付けていません

Object-Centric Domain Randomization for 3D Shape Reconstruction in the Wild

要約 実際のシングルビュー 3D 形状再構成における最大の課題の 1 つは、実世 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Object-Centric Domain Randomization for 3D Shape Reconstruction in the Wild はコメントを受け付けていません

Instance-aware Exploration-Verification-Exploitation for Instance ImageGoal Navigation

要約 新しい具体化されたビジョン タスクとして、インスタンス イメージゴール ナ … 続きを読む

カテゴリー: cs.CV, cs.RO | Instance-aware Exploration-Verification-Exploitation for Instance ImageGoal Navigation はコメントを受け付けていません

Estimating Physical Information Consistency of Channel Data Augmentation for Remote Sensing Images

要約 深層学習 (DL) 手法にデータ拡張を適用することは、教師あり、半教師あり … 続きを読む

カテゴリー: cs.CV, cs.LG | Estimating Physical Information Consistency of Channel Data Augmentation for Remote Sensing Images はコメントを受け付けていません

DINO-Tracker: Taming DINO for Self-Supervised Point Tracking in a Single Video

要約 私たちは DINO-Tracker を紹介します — ビデオに … 続きを読む

カテゴリー: cs.CV | DINO-Tracker: Taming DINO for Self-Supervised Point Tracking in a Single Video はコメントを受け付けていません

MedMamba: Vision Mamba for Medical Image Classification

要約 医療画像の分類は、コンピューター ビジョンの分野において非常に基本的かつ重 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | MedMamba: Vision Mamba for Medical Image Classification はコメントを受け付けていません