月別アーカイブ: 2023年3月

Mask3D: Pre-training 2D Vision Transformers by Learning Masked 3D Priors

要約 ビジョン トランスフォーマー (ViT) や ResNets など、コンピ … 続きを読む

カテゴリー: cs.CV | Mask3D: Pre-training 2D Vision Transformers by Learning Masked 3D Priors はコメントを受け付けていません

Does Learning from Decentralized Non-IID Unlabeled Data Benefit from Self Supervision?

要約 分散型学習は、教師あり学習 (SL) の問題に重点を置いて、分散データセッ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Does Learning from Decentralized Non-IID Unlabeled Data Benefit from Self Supervision? はコメントを受け付けていません

Kartezio: Evolutionary Design of Explainable Pipelines for Biomedical Image Analysis

要約 現代の生物医学における未解決の問題は、注釈、分析、および解釈を必要とする複 … 続きを読む

カテゴリー: cs.CV, cs.NE | Kartezio: Evolutionary Design of Explainable Pipelines for Biomedical Image Analysis はコメントを受け付けていません

Membership Inference Attack for Beluga Whales Discrimination

要約 特定の野生生物個体群の成長と進化を効率的に監視するために、動物生態学で取り … 続きを読む

カテゴリー: cs.CV | Membership Inference Attack for Beluga Whales Discrimination はコメントを受け付けていません

Data Splits and Metrics for Method Benchmarking on Surgical Action Triplet Datasets

要約 ベンチマーク データセットの作成には、データと注釈の生成に加えて、賢明なデ … 続きを読む

カテゴリー: cs.CV | Data Splits and Metrics for Method Benchmarking on Surgical Action Triplet Datasets はコメントを受け付けていません

Generic-to-Specific Distillation of Masked Autoencoders

要約 自己管理型の事前トレーニング メカニズムによって駆動される大型ビジョン ト … 続きを読む

カテゴリー: cs.CV | Generic-to-Specific Distillation of Masked Autoencoders はコメントを受け付けていません

PA&DA: Jointly Sampling PAth and DAta for Consistent NAS

要約 重み共有メカニズムに基づいて、ワンショット NAS メソッドはスーパーネッ … 続きを読む

カテゴリー: cs.CV, cs.LG | PA&DA: Jointly Sampling PAth and DAta for Consistent NAS はコメントを受け付けていません

VQA with Cascade of Self- and Co-Attention Blocks

要約 複雑なアテンション モジュールを使用することで、Visual Questi … 続きを読む

カテゴリー: cs.AI, cs.CV | VQA with Cascade of Self- and Co-Attention Blocks はコメントを受け付けていません

DROID: Driver-centric Risk Object Identification

要約 リスクの高い運転状況の識別は、一般に、衝突リスクの推定または事故パターンの … 続きを読む

カテゴリー: cs.CV, cs.RO | DROID: Driver-centric Risk Object Identification はコメントを受け付けていません

Meta Learning to Bridge Vision and Language Models for Multimodal Few-Shot Learning

要約 マルチモーダルの少数ショット学習は、視覚と言語モダリティの間に大きなドメイ … 続きを読む

カテゴリー: cs.CV | Meta Learning to Bridge Vision and Language Models for Multimodal Few-Shot Learning はコメントを受け付けていません