月別アーカイブ: 2024年5月

Xmodel-VLM: A Simple Baseline for Multimodal Vision Language Model

要約 最先端のマルチモーダル ビジョン言語モデルである Xmodel-VLM を … 続きを読む

カテゴリー: cs.AI, cs.CV | Xmodel-VLM: A Simple Baseline for Multimodal Vision Language Model はコメントを受け付けていません

Wild Berry image dataset collected in Finnish forests and peatlands using drones

要約 ベリー狩りはフィンランドに長年の伝統がありますが、挑戦的で潜在的に危険な場 … 続きを読む

カテゴリー: cs.CV | Wild Berry image dataset collected in Finnish forests and peatlands using drones はコメントを受け付けていません

3D Diffusion Policy: Generalizable Visuomotor Policy Learning via Simple 3D Representations

要約 模倣学習はロボットに器用なスキルを教える効率的な方法を提供します。 ただし … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | 3D Diffusion Policy: Generalizable Visuomotor Policy Learning via Simple 3D Representations はコメントを受け付けていません

Graph Neural Network based Handwritten Trajectories Recognition

要約 グラフ ニューラル ネットワークは、現実のアプリケーションにおいて効率的な … 続きを読む

カテゴリー: cs.CV, cs.LG | Graph Neural Network based Handwritten Trajectories Recognition はコメントを受け付けていません

RaffeSDG: Random Frequency Filtering enabled Single-source Domain Generalization for Medical Image Segmentation

要約 ディープ ラーニング モデルは、ソース データとターゲット データの間でド … 続きを読む

カテゴリー: cs.CV | RaffeSDG: Random Frequency Filtering enabled Single-source Domain Generalization for Medical Image Segmentation はコメントを受け付けていません

Similarity Metrics for MR Image-To-Image Translation

要約 画像間の変換は、医療画像処理に大きな影響を与える可能性があります。つまり、 … 続きを読む

カテゴリー: cs.CV, eess.IV | Similarity Metrics for MR Image-To-Image Translation はコメントを受け付けていません

Dance Any Beat: Blending Beats with Visuals in Dance Video Generation

要約 音楽からダンスを生成するというタスクは重要ですが、主に関節シーケンスを生成 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM, cs.SD, eess.AS | Dance Any Beat: Blending Beats with Visuals in Dance Video Generation はコメントを受け付けていません

MVBIND: Self-Supervised Music Recommendation For Videos Via Embedding Space Binding

要約 近年、通常、ビジュアルとオーディオの両方のモダリティを含むショートビデオが … 続きを読む

カテゴリー: cs.CV, cs.MM | MVBIND: Self-Supervised Music Recommendation For Videos Via Embedding Space Binding はコメントを受け付けていません

DeCoDEx: Confounder Detector Guidance for Improved Diffusion-based Counterfactual Explanations

要約 ディープ ラーニング分類器は、ターゲット クラスに関連付けられた因果マーカ … 続きを読む

カテゴリー: cs.CV | DeCoDEx: Confounder Detector Guidance for Improved Diffusion-based Counterfactual Explanations はコメントを受け付けていません

LRVS-Fashion: Extending Visual Search with Referring Instructions

要約 この論文では、ファッションの文脈における画像類似性検索の新たな課題を紹介し … 続きを読む

カテゴリー: (Primary), cs.CV, I.2.10 | LRVS-Fashion: Extending Visual Search with Referring Instructions はコメントを受け付けていません