月別アーカイブ: 2024年7月

Action2Sound: Ambient-Aware Generation of Action Sounds from Egocentric Videos

要約 人間の動作に合わせてリアルなオーディオを生成することは、映画や仮想現実ゲー … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.SD, eess.AS | Action2Sound: Ambient-Aware Generation of Action Sounds from Egocentric Videos はコメントを受け付けていません

Multi-Resolution Histopathology Patch Graphs for Ovarian Cancer Subtyping

要約 コンピュータビジョンモデルは、卵巣上皮がんのサブタイプを分類できるようにな … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | Multi-Resolution Histopathology Patch Graphs for Ovarian Cancer Subtyping はコメントを受け付けていません

Towards More Practical Group Activity Detection: A New Benchmark and Model

要約 グループ アクティビティ検出 (GAD) は、ビデオ内で各グループのメンバ … 続きを読む

カテゴリー: cs.CV | Towards More Practical Group Activity Detection: A New Benchmark and Model はコメントを受け付けていません

Keypoint Promptable Re-Identification

要約 遮蔽された人物の再識別 (ReID) は、遮蔽された個人を外観に基づいて照 … 続きを読む

カテゴリー: cs.CV | Keypoint Promptable Re-Identification はコメントを受け付けていません

Efficient Inference of Vision Instruction-Following Models with Elastic Cache

要約 命令追従型ラージ ビジョン言語モデル (LVLM) の分野では、これらのモ … 続きを読む

カテゴリー: cs.CV | Efficient Inference of Vision Instruction-Following Models with Elastic Cache はコメントを受け付けていません

Better Call SAL: Towards Learning to Segment Anything in Lidar

要約 我々は、Lidar 内の任意のオブジェクトをセグメント化して分類するための … 続きを読む

カテゴリー: cs.CV, cs.RO | Better Call SAL: Towards Learning to Segment Anything in Lidar はコメントを受け付けていません

Self-supervised pre-training with diffusion model for few-shot landmark detection in x-ray images

要約 ここ数年、ディープ ニューラル ネットワークは、画像の分類やセグメンテーシ … 続きを読む

カテゴリー: cs.AI, cs.CV | Self-supervised pre-training with diffusion model for few-shot landmark detection in x-ray images はコメントを受け付けていません

Estimating Earthquake Magnitude in Sentinel-1 Imagery via Ranking

要約 地震は通常、物理的な地震観測所を使用して推定されますが、これらの観測所の設 … 続きを読む

カテゴリー: cs.CV, eess.IV | Estimating Earthquake Magnitude in Sentinel-1 Imagery via Ranking はコメントを受け付けていません

$\mathbb{X}$-Sample Contrastive Loss: Improving Contrastive Learning with Sample Similarity Graphs

要約 優れた表現を学習するには、データ サンプルが関連するさまざまな方法を把握す … 続きを読む

カテゴリー: cs.CV, cs.LG | $\mathbb{X}$-Sample Contrastive Loss: Improving Contrastive Learning with Sample Similarity Graphs はコメントを受け付けていません

XS-VID: An Extremely Small Video Object Detection Dataset

要約 Small Video Object Detection (SVOD) は … 続きを読む

カテゴリー: cs.CV | XS-VID: An Extremely Small Video Object Detection Dataset はコメントを受け付けていません