月別アーカイブ: 2023年9月

Sound Source Localization is All about Cross-Modal Alignment

投稿日: 2023年9月20日作成者: jarxiv

要約人間は、音源定位と呼ばれる、視覚的なシーンにおける音源の方向を容易に認識で … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

Causality-Driven One-Shot Learning for Prostate Cancer Grading from MRI

投稿日: 2023年9月20日作成者: jarxiv

要約この論文では、画像内の弱い因果信号を学習して活用する、医療画像を自動的に分 … 続きを読む →

カテゴリー: cs.AI, cs.CV, I.2 | コメントを受け付けていません

Few-Shot Panoptic Segmentation With Foundation Models

投稿日: 2023年9月20日作成者: jarxiv

要約パノプティックセグメンテーションの現在の最先端の方法では、膨大な量の注釈 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

MMST-ViT: Climate Change-aware Crop Yield Prediction via Multi-Modal Spatial-Temporal Vision Transformer

投稿日: 2023年9月20日作成者: jarxiv

要約正確な作物収量予測は、農業計画と意思決定プロセスに貴重な情報を提供します。 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Reliable Federated Disentangling Network for Non-IID Domain Feature

投稿日: 2023年9月20日作成者: jarxiv

要約効果的な分散型分散学習アプローチとしてのフェデレーテッドラーニング (F … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

SHOWMe: Benchmarking Object-agnostic Hand-Object 3D Reconstruction

投稿日: 2023年9月20日作成者: jarxiv

要約最近の手とオブジェクトの相互作用データセットは、実際のオブジェクトの変動性 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG, cs.RO | コメントを受け付けていません

MAGIC-TBR: Multiview Attention Fusion for Transformer-based Bodily Behavior Recognition in Group Settings

投稿日: 2023年9月20日作成者: jarxiv

要約身体行動言語は重要な社会的合図であり、その自動分析は人工知能システムの理解 … 続きを読む →

カテゴリー: cs.CV, cs.HC, cs.MM | コメントを受け付けていません

Language as the Medium: Multimodal Video Classification through text only

投稿日: 2023年9月20日作成者: jarxiv

要約マルチモーダル機械学習モデルの刺激的な新しい波にもかかわらず、現在のアプロ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

Context-Aware Neural Video Compression on Solar Dynamics Observatory

投稿日: 2023年9月20日作成者: jarxiv

要約 NASA の太陽力学観測所 (SDO) ミッションは、太陽の毎日の活動に関 … 続きを読む →

カテゴリー: astro-ph.SR, cs.CV, cs.IT, cs.LG, eess.IV, math.IT | コメントを受け付けていません

AV-SUPERB: A Multi-Task Evaluation Benchmark for Audio-Visual Representation Models

投稿日: 2023年9月20日作成者: jarxiv

要約視聴覚表現学習は、聴覚情報と視覚情報の相関関係を利用して、人間のような知覚 … 続きを読む →

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

月別アーカイブ: 2023年9月

Sound Source Localization is All about Cross-Modal Alignment

Causality-Driven One-Shot Learning for Prostate Cancer Grading from MRI

Few-Shot Panoptic Segmentation With Foundation Models

MMST-ViT: Climate Change-aware Crop Yield Prediction via Multi-Modal Spatial-Temporal Vision Transformer

Reliable Federated Disentangling Network for Non-IID Domain Feature

SHOWMe: Benchmarking Object-agnostic Hand-Object 3D Reconstruction

MAGIC-TBR: Multiview Attention Fusion for Transformer-based Bodily Behavior Recognition in Group Settings

Language as the Medium: Multimodal Video Classification through text only

Context-Aware Neural Video Compression on Solar Dynamics Observatory

AV-SUPERB: A Multi-Task Evaluation Benchmark for Audio-Visual Representation Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー