cs.LG」カテゴリーアーカイブ

Elementwise Layer Normalization

要約 最近の論文では、層の正規化のドロップイン置換として動的タン(DYT)を提案 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Elementwise Layer Normalization はコメントを受け付けていません

GenoTEX: A Benchmark for Automated Gene Expression Data Analysis in Alignment with Bioinformaticians

要約 機械学習における最近の進歩により、遺伝子発現データセットからの疾患関連遺伝 … 続きを読む

カテゴリー: cs.AI, cs.LG, q-bio.GN | GenoTEX: A Benchmark for Automated Gene Expression Data Analysis in Alignment with Bioinformaticians はコメントを受け付けていません

Self-Contrastive Forward-Forward Algorithm

要約 自律的に動作するエージェントは、生涯学習能力の恩恵を受けます。 ただし、互 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.ET, cs.LG, cs.NE | Self-Contrastive Forward-Forward Algorithm はコメントを受け付けていません

Cognitive Science-Inspired Evaluation of Core Capabilities for Object Understanding in AI

要約 私たちの世界モデルのコアコンポーネントの1つは、「直感的な物理学」です。オ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Cognitive Science-Inspired Evaluation of Core Capabilities for Object Understanding in AI はコメントを受け付けていません

Multi-View and Multi-Scale Alignment for Contrastive Language-Image Pre-training in Mammography

要約 対照的な言語イメージ前訓練(CLIP)は、医療画像分析に強い可能性を示して … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Multi-View and Multi-Scale Alignment for Contrastive Language-Image Pre-training in Mammography はコメントを受け付けていません

CTRL-O: Language-Controllable Object-Centric Visual Representation Learning

要約 オブジェクト中心の表現学習は、視覚的なシーンを「スロット」または「オブジェ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | CTRL-O: Language-Controllable Object-Centric Visual Representation Learning はコメントを受け付けていません

Fwd2Bot: LVLM Visual Token Compression with Double Forward Bottleneck

要約 この作業では、大規模なビジョン言語モデル(LVLM)のビジョントークンを、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Fwd2Bot: LVLM Visual Token Compression with Double Forward Bottleneck はコメントを受け付けていません

Uni4D: Unifying Visual Foundation Models for 4D Modeling from a Single Video

要約 このペーパーでは、カジュアルなビデオの動的なシーンを理解するための統一され … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Uni4D: Unifying Visual Foundation Models for 4D Modeling from a Single Video はコメントを受け付けていません

StyleMotif: Multi-Modal Motion Stylization using Style-Content Cross Fusion

要約 新しい様式化された運動潜在拡散モデルであるStylemotifを提示し、複 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | StyleMotif: Multi-Modal Motion Stylization using Style-Content Cross Fusion はコメントを受け付けていません

Test-Time Visual In-Context Tuning

要約 視覚的なコンテキスト学習(VICL)は、コンピュータービジョンの新しいパラ … 続きを読む

カテゴリー: cs.CV, cs.LG | Test-Time Visual In-Context Tuning はコメントを受け付けていません