月別アーカイブ: 2023年2月

Self-supervised Action Representation Learning from Partial Spatio-Temporal Skeleton Sequences

要約 自己教師あり学習は、骨格ベースの行動認識の表現学習において顕著な能力を発揮 … 続きを読む

カテゴリー: cs.CV | Self-supervised Action Representation Learning from Partial Spatio-Temporal Skeleton Sequences はコメントを受け付けていません

CK-Transformer: Commonsense Knowledge Enhanced Transformers for Referring Expression Comprehension

要約 自然言語表現によって記述された画像領域のローカライズを目的としたマルチモー … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | CK-Transformer: Commonsense Knowledge Enhanced Transformers for Referring Expression Comprehension はコメントを受け付けていません

Sparse Upcycling: Training Mixture-of-Experts from Dense Checkpoints

要約 大規模で深いニューラル ネットワークを収束までトレーニングすると、法外なコ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | Sparse Upcycling: Training Mixture-of-Experts from Dense Checkpoints はコメントを受け付けていません

Self-Supervised Representation Learning from Temporal Ordering of Automated Driving Sequences

要約 自己教師あり特徴学習により、知覚システムは、世界中の車両によって記録されて … 続きを読む

カテゴリー: cs.CV | Self-Supervised Representation Learning from Temporal Ordering of Automated Driving Sequences はコメントを受け付けていません

OTB-morph: One-Time Biometrics via Morphing

要約 キャンセル可能な生体認証は、生体認証システムでセキュリティとプライバシーを … 続きを読む

カテゴリー: cs.CR, cs.CV, cs.LG | OTB-morph: One-Time Biometrics via Morphing はコメントを受け付けていません

Consistent Diffusion Models: Mitigating Sampling Drift by Learning to be Consistent

要約 不完全なスコア マッチングは、トレーニングと拡散モデルのサンプリング分布の … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.IT, cs.LG, math.IT | Consistent Diffusion Models: Mitigating Sampling Drift by Learning to be Consistent はコメントを受け付けていません

Effects of Image Size on Deep Learning

要約 この作業では、トレーニング データセット内の後期ガドリニウム増強 (LGE … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Effects of Image Size on Deep Learning はコメントを受け付けていません

Large Language Models Fail on Trivial Alterations to Theory-of-Mind Tasks

要約 直観心理学は、常識的な推論の柱です。 機械知能におけるこの推論の複製は、人 … 続きを読む

カテゴリー: cs.AI, cs.CL, I.2.7 | Large Language Models Fail on Trivial Alterations to Theory-of-Mind Tasks はコメントを受け付けていません

Efficiency 360: Efficient Vision Transformers

要約 トランスフォーマーは、自然言語処理、コンピューター ビジョン、音声、および … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Efficiency 360: Efficient Vision Transformers はコメントを受け付けていません

Write and Paint: Generative Vision-Language Models are Unified Modal Learners

要約 視覚言語の事前トレーニングにおける最近の進歩により、さまざまな視覚言語タス … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | Write and Paint: Generative Vision-Language Models are Unified Modal Learners はコメントを受け付けていません