月別アーカイブ: 2024年7月

Action2Sound: Ambient-Aware Generation of Action Sounds from Egocentric Videos

投稿日: 2024年7月26日作成者: jarxiv

要約人間の動作に合わせてリアルなオーディオを生成することは、映画や仮想現実ゲー … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.SD, eess.AS | コメントを受け付けていません

Multi-Resolution Histopathology Patch Graphs for Ovarian Cancer Subtyping

投稿日: 2024年7月26日作成者: jarxiv

要約コンピュータビジョンモデルは、卵巣上皮がんのサブタイプを分類できるようにな … 続きを読む →

カテゴリー: cs.AI, cs.CV, eess.IV | コメントを受け付けていません

Towards More Practical Group Activity Detection: A New Benchmark and Model

投稿日: 2024年7月26日作成者: jarxiv

要約グループアクティビティ検出 (GAD) は、ビデオ内で各グループのメンバ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Keypoint Promptable Re-Identification

投稿日: 2024年7月26日作成者: jarxiv

要約遮蔽された人物の再識別 (ReID) は、遮蔽された個人を外観に基づいて照 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Efficient Inference of Vision Instruction-Following Models with Elastic Cache

投稿日: 2024年7月26日作成者: jarxiv

要約命令追従型ラージビジョン言語モデル (LVLM) の分野では、これらのモ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Better Call SAL: Towards Learning to Segment Anything in Lidar

投稿日: 2024年7月26日作成者: jarxiv

要約我々は、Lidar 内の任意のオブジェクトをセグメント化して分類するための … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Self-supervised pre-training with diffusion model for few-shot landmark detection in x-ray images

投稿日: 2024年7月26日作成者: jarxiv

要約ここ数年、ディープニューラルネットワークは、画像の分類やセグメンテーシ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Estimating Earthquake Magnitude in Sentinel-1 Imagery via Ranking

投稿日: 2024年7月26日作成者: jarxiv

要約地震は通常、物理的な地震観測所を使用して推定されますが、これらの観測所の設 … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

$\mathbb{X}$-Sample Contrastive Loss: Improving Contrastive Learning with Sample Similarity Graphs

投稿日: 2024年7月26日作成者: jarxiv

要約優れた表現を学習するには、データサンプルが関連するさまざまな方法を把握す … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

XS-VID: An Extremely Small Video Object Detection Dataset

投稿日: 2024年7月26日作成者: jarxiv

要約 Small Video Object Detection (SVOD) は … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

月別アーカイブ: 2024年7月

Action2Sound: Ambient-Aware Generation of Action Sounds from Egocentric Videos

Multi-Resolution Histopathology Patch Graphs for Ovarian Cancer Subtyping

Towards More Practical Group Activity Detection: A New Benchmark and Model

Keypoint Promptable Re-Identification

Efficient Inference of Vision Instruction-Following Models with Elastic Cache

Better Call SAL: Towards Learning to Segment Anything in Lidar

Self-supervised pre-training with diffusion model for few-shot landmark detection in x-ray images

Estimating Earthquake Magnitude in Sentinel-1 Imagery via Ranking

$\mathbb{X}$-Sample Contrastive Loss: Improving Contrastive Learning with Sample Similarity Graphs

XS-VID: An Extremely Small Video Object Detection Dataset

最近の投稿

最近のコメント

アーカイブ

カテゴリー