月別アーカイブ: 2023年9月

Sound Source Localization is All about Cross-Modal Alignment

要約 人間は、音源定位と呼ばれる、視覚的なシーンにおける音源の方向を容易に認識で … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM, cs.SD, eess.AS | Sound Source Localization is All about Cross-Modal Alignment はコメントを受け付けていません

Causality-Driven One-Shot Learning for Prostate Cancer Grading from MRI

要約 この論文では、画像内の弱い因果信号を学習して活用する、医療画像を自動的に分 … 続きを読む

カテゴリー: cs.AI, cs.CV, I.2 | Causality-Driven One-Shot Learning for Prostate Cancer Grading from MRI はコメントを受け付けていません

Few-Shot Panoptic Segmentation With Foundation Models

要約 パノプティック セグメンテーションの現在の最先端の方法では、膨大な量の注釈 … 続きを読む

カテゴリー: cs.CV, cs.RO | Few-Shot Panoptic Segmentation With Foundation Models はコメントを受け付けていません

MMST-ViT: Climate Change-aware Crop Yield Prediction via Multi-Modal Spatial-Temporal Vision Transformer

要約 正確な作物収量予測は、農業計画と意思決定プロセスに貴重な情報を提供します。 … 続きを読む

カテゴリー: cs.CV | MMST-ViT: Climate Change-aware Crop Yield Prediction via Multi-Modal Spatial-Temporal Vision Transformer はコメントを受け付けていません

Reliable Federated Disentangling Network for Non-IID Domain Feature

要約 効果的な分散型分散学習アプローチとしてのフェデレーテッド ラーニング (F … 続きを読む

カテゴリー: cs.CV | Reliable Federated Disentangling Network for Non-IID Domain Feature はコメントを受け付けていません

SHOWMe: Benchmarking Object-agnostic Hand-Object 3D Reconstruction

要約 最近の手とオブジェクトの相互作用データセットは、実際のオブジェクトの変動性 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG, cs.RO | SHOWMe: Benchmarking Object-agnostic Hand-Object 3D Reconstruction はコメントを受け付けていません

MAGIC-TBR: Multiview Attention Fusion for Transformer-based Bodily Behavior Recognition in Group Settings

要約 身体行動言語は重要な社会的合図であり、その自動分析は人工知能システムの理解 … 続きを読む

カテゴリー: cs.CV, cs.HC, cs.MM | MAGIC-TBR: Multiview Attention Fusion for Transformer-based Bodily Behavior Recognition in Group Settings はコメントを受け付けていません

Language as the Medium: Multimodal Video Classification through text only

要約 マルチモーダル機械学習モデルの刺激的な新しい波にもかかわらず、現在のアプロ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Language as the Medium: Multimodal Video Classification through text only はコメントを受け付けていません

Context-Aware Neural Video Compression on Solar Dynamics Observatory

要約 NASA の太陽力学観測所 (SDO) ミッションは、太陽の毎日の活動に関 … 続きを読む

カテゴリー: astro-ph.SR, cs.CV, cs.IT, cs.LG, eess.IV, math.IT | Context-Aware Neural Video Compression on Solar Dynamics Observatory はコメントを受け付けていません

AV-SUPERB: A Multi-Task Evaluation Benchmark for Audio-Visual Representation Models

要約 視聴覚表現学習は、聴覚情報と視覚情報の相関関係を利用して、人間のような知覚 … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | AV-SUPERB: A Multi-Task Evaluation Benchmark for Audio-Visual Representation Models はコメントを受け付けていません