cs.LG」カテゴリーアーカイブ

Rethinking the Bias of Foundation Model under Long-tailed Distribution

要約 長期にわたる学習は、その実際的な重要性のために注目を集めています。 さまざ … 続きを読む

カテゴリー: cs.CV, cs.LG, stat.ML | Rethinking the Bias of Foundation Model under Long-tailed Distribution はコメントを受け付けていません

Evaluating Data Influence in Meta Learning

要約 最も基本的なモデルの1つとして、Meta Learningは、少数のショッ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Evaluating Data Influence in Meta Learning はコメントを受け付けていません

Textualize Visual Prompt for Image Editing via Diffusion Bridge

要約 前後に編集された画像のペアであるVisual Promptは、説明できない … 続きを読む

カテゴリー: cs.CV, cs.LG | Textualize Visual Prompt for Image Editing via Diffusion Bridge はコメントを受け付けていません

MatCLIP: Light- and Shape-Insensitive Assignment of PBR Material Models

要約 3Dモデルに現実的な資料を割り当てることは、コンピューターグラフィックスの … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.LG | MatCLIP: Light- and Shape-Insensitive Assignment of PBR Material Models はコメントを受け付けていません

Controllable Forgetting Mechanism for Few-Shot Class-Incremental Learning

要約 限られた個人ラベル付きサンプル(少数のショット)のコンテキストでのクラスイ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Controllable Forgetting Mechanism for Few-Shot Class-Incremental Learning はコメントを受け付けていません

Dimensions underlying the representational alignment of deep neural networks with humans

要約 人間と人工知能(AI)の類似性と相違点を判断することは、計算認知神経科学と … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, q-bio.QM | Dimensions underlying the representational alignment of deep neural networks with humans はコメントを受け付けていません

Accelerating lensed quasar discovery and modeling with physics-informed variational autoencoders

要約 強くレンズされたクエーサーは、宇宙の拡大の速度、フォアグラウンドの偏向者に … 続きを読む

カテゴリー: astro-ph.CO, astro-ph.GA, astro-ph.IM, cs.CV, cs.LG | Accelerating lensed quasar discovery and modeling with physics-informed variational autoencoders はコメントを受け付けていません

Automated Detection of Sport Highlights from Audio and Video Sources

要約 この研究では、オーディオおよびビデオソースからのスポーツハイライト(HLS … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Automated Detection of Sport Highlights from Audio and Video Sources はコメントを受け付けていません

2.5 Years in Class: A Multimodal Textbook for Vision-Language Pretraining

要約 画像テキストペアデータと比較して、インターリーブコーポラは、ビジョン言語モ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | 2.5 Years in Class: A Multimodal Textbook for Vision-Language Pretraining はコメントを受け付けていません

Mixture-of-Mamba: Enhancing Multi-Modal State-Space Models with Modality-Aware Sparsity

要約 状態空間モデル(SSM)は、シーケンシャルモデリングのための変圧器の効率的 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Mixture-of-Mamba: Enhancing Multi-Modal State-Space Models with Modality-Aware Sparsity はコメントを受け付けていません