月別アーカイブ: 2023年8月

Experts Weights Averaging: A New General Training Scheme for Vision Transformers

要約 構造の再パラメータ化は、畳み込みニューラル ネットワーク (CNN) の一 … 続きを読む

カテゴリー: cs.CV, cs.LG | Experts Weights Averaging: A New General Training Scheme for Vision Transformers はコメントを受け付けていません

Weakly-Supervised Text-driven Contrastive Learning for Facial Behavior Understanding

要約 対照学習は、ラベルのないデータを利用して堅牢な表現を学習できる有望な可能性 … 続きを読む

カテゴリー: cs.CV | Weakly-Supervised Text-driven Contrastive Learning for Facial Behavior Understanding はコメントを受け付けていません

Using Visual and Vehicular Sensors for Driver Behavior Analysis: A Survey

要約 米国における死亡事故の 70% は危険なドライバーによるものです。 最近の … 続きを読む

カテゴリー: cs.CV, cs.LG | Using Visual and Vehicular Sensors for Driver Behavior Analysis: A Survey はコメントを受け付けていません

Single-Stage Diffusion NeRF: A Unified Approach to 3D Generation and Reconstruction

要約 3D 対応の画像合成には、画像からのシーン生成や新しいビューの合成など、さ … 続きを読む

カテゴリー: cs.CV | Single-Stage Diffusion NeRF: A Unified Approach to 3D Generation and Reconstruction はコメントを受け付けていません

Harvard Glaucoma Detection and Progression: A Multimodal Multitask Dataset and Generalization-Reinforced Semi-Supervised Learning

要約 緑内障は、世界的に不可逆的な失明の最大の原因です。 正確な緑内障の検出と進 … 続きを読む

カテゴリー: cs.CV | Harvard Glaucoma Detection and Progression: A Multimodal Multitask Dataset and Generalization-Reinforced Semi-Supervised Learning はコメントを受け付けていません

An investigation into the impact of deep learning model choice on sex and race bias in cardiac MR segmentation

要約 医療画像処理では、日常業務を自動化するために人工知能 (AI) の使用が増 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | An investigation into the impact of deep learning model choice on sex and race bias in cardiac MR segmentation はコメントを受け付けていません

What’s the Difference? The potential for Convolutional Neural Networks for transient detection without template subtraction

要約 私たちは、畳み込みニューラル ネットワーク (CNN) が画像アーティファ … 続きを読む

カテゴリー: astro-ph.IM, cs.CV | What’s the Difference? The potential for Convolutional Neural Networks for transient detection without template subtraction はコメントを受け付けていません

LATFormer: Locality-Aware Point-View Fusion Transformer for 3D Shape Recognition

要約 最近、画像、ボクセル、点群などのさまざまなデータ形式での深層学習モデルの進 … 続きを読む

カテゴリー: cs.CV | LATFormer: Locality-Aware Point-View Fusion Transformer for 3D Shape Recognition はコメントを受け付けていません

Nougat: Neural Optical Understanding for Academic Documents

要約 科学知識は主に書籍や科学雑誌に保存されており、多くの場合 PDF の形式で … 続きを読む

カテゴリー: cs.CV, cs.LG | Nougat: Neural Optical Understanding for Academic Documents はコメントを受け付けていません

Exploiting Diverse Feature for Multimodal Sentiment Analysis

要約 このペーパーでは、MuSe 2023 マルチモーダル感情分析チャレンジの … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | Exploiting Diverse Feature for Multimodal Sentiment Analysis はコメントを受け付けていません