月別アーカイブ: 2023年7月

See Through the Fog: Curriculum Learning with Progressive Occlusion in Medical Imaging

要約 近年、ディープラーニング モデルは医療画像の読影に革命をもたらし、診断精度 … 続きを読む

カテゴリー: 68T05, 68T10, 92C55, cs.CV, cs.LG, I.5.1 | See Through the Fog: Curriculum Learning with Progressive Occlusion in Medical Imaging はコメントを受け付けていません

MTR++: Multi-Agent Motion Prediction with Symmetric Scene Modeling and Guided Intention Querying

要約 動き予測は、自動運転システムが複雑な運転シナリオを理解し、情報に基づいた意 … 続きを読む

カテゴリー: cs.CV | MTR++: Multi-Agent Motion Prediction with Symmetric Scene Modeling and Guided Intention Querying はコメントを受け付けていません

Look, Remember and Reason: Visual Reasoning with Grounded Rationales

要約 最近、大規模な言語モデルは、さまざまな推論タスクにおいて人間レベルのパフォ … 続きを読む

カテゴリー: cs.CV, cs.LG | Look, Remember and Reason: Visual Reasoning with Grounded Rationales はコメントを受け付けていません

Stay on topic with Classifier-Free Guidance

要約 Classifier-Free Guide (CFG) は、世代間の即時遵 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | Stay on topic with Classifier-Free Guidance はコメントを受け付けていません

Leveraging Ensembles and Self-Supervised Learning for Fully-Unsupervised Person Re-Identification and Text Authorship Attribution

要約 完全にラベルのないデータから学習することは、人物の再識別やテキストの著者帰 … 続きを読む

カテゴリー: cs.CV | Leveraging Ensembles and Self-Supervised Learning for Fully-Unsupervised Person Re-Identification and Text Authorship Attribution はコメントを受け付けていません

Fact or Artifact? Revise Layer-wise Relevance Propagation on various ANN Architectures

要約 Layer-wise Relevance Propagation (LRP … 続きを読む

カテゴリー: cs.CV, cs.LG | Fact or Artifact? Revise Layer-wise Relevance Propagation on various ANN Architectures はコメントを受け付けていません

Federated Ensemble YOLOv5 – A Better Generalized Object Detection Algorithm

要約 フェデレーテッド ラーニング (FL) はプライバシー保護アルゴリズムとし … 続きを読む

カテゴリー: cs.CV, cs.LG | Federated Ensemble YOLOv5 – A Better Generalized Object Detection Algorithm はコメントを受け付けていません

SPAE: Semantic Pyramid AutoEncoder for Multimodal Generation with Frozen LLMs

要約 この研究では、凍結された LLM が画像やビデオなどの非言語モダリティを含 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.MM | SPAE: Semantic Pyramid AutoEncoder for Multimodal Generation with Frozen LLMs はコメントを受け付けていません

Magic123: One Image to High-Quality 3D Object Generation Using Both 2D and 3D Diffusion Priors

要約 我々は、2D と 3D の両方の事前分布を使用して、野生の単一のポーズ化さ … 続きを読む

カテゴリー: cs.CV | Magic123: One Image to High-Quality 3D Object Generation Using Both 2D and 3D Diffusion Priors はコメントを受け付けていません

Hardwiring ViT Patch Selectivity into CNNs using Patch Mixing

要約 ビジョン トランスフォーマー (ViT) はコンピューター ビジョンの状況 … 続きを読む

カテゴリー: cs.CV | Hardwiring ViT Patch Selectivity into CNNs using Patch Mixing はコメントを受け付けていません