月別アーカイブ: 2024年3月

Click to Grasp: Zero-Shot Precise Manipulation via Visual Diffusion Descriptors

投稿日: 2024年3月22日作成者: jarxiv

要約ロボット工学においては、シーンやオブジェクト全体で一般化できる正確な操作が … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

Chain-of-Spot: Interactive Reasoning Improves Large Vision-Language Models

投稿日: 2024年3月22日作成者: jarxiv

要約視覚言語理解の領域では、視覚コンテンツの解釈と推論におけるモデルの熟練度が … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

HAC: Hash-grid Assisted Context for 3D Gaussian Splatting Compression

投稿日: 2024年3月22日作成者: jarxiv

要約 3D ガウススプラッティング (3DGS) は、高い忠実度で高速なレンダ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Transfer Learning for Cross-dataset Isolated Sign Language Recognition in Under-Resourced Datasets

投稿日: 2024年3月22日作成者: jarxiv

要約手話認識 (SLR) は、大規模な注釈付き手話データセットでトレーニングさ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Generalizing deep learning models for medical image classification

投稿日: 2024年3月22日作成者: jarxiv

要約多数の深層学習 (DL) モデルが広範な医用画像分析アプリケーション向けに … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

Object-Centric Domain Randomization for 3D Shape Reconstruction in the Wild

投稿日: 2024年3月22日作成者: jarxiv

要約実際のシングルビュー 3D 形状再構成における最大の課題の 1 つは、実世 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Instance-aware Exploration-Verification-Exploitation for Instance ImageGoal Navigation

投稿日: 2024年3月22日作成者: jarxiv

要約新しい具体化されたビジョンタスクとして、インスタンスイメージゴールナ … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Estimating Physical Information Consistency of Channel Data Augmentation for Remote Sensing Images

投稿日: 2024年3月22日作成者: jarxiv

要約深層学習 (DL) 手法にデータ拡張を適用することは、教師あり、半教師あり … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

DINO-Tracker: Taming DINO for Self-Supervised Point Tracking in a Single Video

投稿日: 2024年3月22日作成者: jarxiv

要約私たちは DINO-Tracker を紹介します — ビデオに … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

MedMamba: Vision Mamba for Medical Image Classification

投稿日: 2024年3月22日作成者: jarxiv

要約医療画像の分類は、コンピュータービジョンの分野において非常に基本的かつ重 … 続きを読む →

カテゴリー: cs.CV, cs.LG, eess.IV | コメントを受け付けていません

月別アーカイブ: 2024年3月

Click to Grasp: Zero-Shot Precise Manipulation via Visual Diffusion Descriptors

Chain-of-Spot: Interactive Reasoning Improves Large Vision-Language Models

HAC: Hash-grid Assisted Context for 3D Gaussian Splatting Compression

Transfer Learning for Cross-dataset Isolated Sign Language Recognition in Under-Resourced Datasets

Generalizing deep learning models for medical image classification

Object-Centric Domain Randomization for 3D Shape Reconstruction in the Wild

Instance-aware Exploration-Verification-Exploitation for Instance ImageGoal Navigation

Estimating Physical Information Consistency of Channel Data Augmentation for Remote Sensing Images

DINO-Tracker: Taming DINO for Self-Supervised Point Tracking in a Single Video

MedMamba: Vision Mamba for Medical Image Classification

最近の投稿

最近のコメント

アーカイブ

カテゴリー