月別アーカイブ: 2024年5月

What matters when building vision-language models?

要約 視覚言語モデル(VLM)への関心の高まりは、大規模言語モデルや視覚変換器の … 続きを読む

カテゴリー: cs.AI, cs.CV | What matters when building vision-language models? はコメントを受け付けていません

On the test-time zero-shot generalization of vision-language models: Do we really need prompt learning?

要約 CLIPに代表される大規模な視覚言語モデルの開発は、特にソフトプロンプトチ … 続きを読む

カテゴリー: cs.CV | On the test-time zero-shot generalization of vision-language models: Do we really need prompt learning? はコメントを受け付けていません

DreamScene4D: Dynamic Multi-Object Scene Generation from Monocular Videos

要約 既存のVLMは、野生の2D映像オブジェクトを追跡することができる一方、現在 … 続きを読む

カテゴリー: cs.CV | DreamScene4D: Dynamic Multi-Object Scene Generation from Monocular Videos はコメントを受け付けていません

Vibe-Eval: A hard evaluation suite for measuring progress of multimodal language models

要約 Vibe-Evalは、マルチモーダルチャットモデルを評価するための新しいオ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Vibe-Eval: A hard evaluation suite for measuring progress of multimodal language models はコメントを受け付けていません

BrainSCUBA: Fine-Grained Natural Language Captions of Visual Cortex Selectivity

要約 高次視覚野の機能的構成を理解することは、神経科学の中心的課題である。これま … 続きを読む

カテゴリー: cs.LG, q-bio.NC | BrainSCUBA: Fine-Grained Natural Language Captions of Visual Cortex Selectivity はコメントを受け付けていません

Accelerating Convergence in Bayesian Few-Shot Classification

要約 ベイズ型少数ショット分類は、少数ショット学習の分野で焦点となっている。本稿 … 続きを読む

カテゴリー: cs.LG, stat.ML | Accelerating Convergence in Bayesian Few-Shot Classification はコメントを受け付けていません

A Careful Examination of Large Language Model Performance on Grade School Arithmetic

要約 大規模言語モデル(LLM)は、数学的推論に関する多くのベンチマークで目覚ま … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | A Careful Examination of Large Language Model Performance on Grade School Arithmetic はコメントを受け付けていません

SATO: Stable Text-to-Motion Framework

要約 Text to Motionモデルはロバストか?最近のText to Mo … 続きを読む

カテゴリー: cs.CV | SATO: Stable Text-to-Motion Framework はコメントを受け付けていません

A separability-based approach to quantifying generalization: which layer is best?

要約 ディープラーニングの分類モデルや基礎モデルにおいて、未知のデータへの汎化に … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, I.2.6 | A separability-based approach to quantifying generalization: which layer is best? はコメントを受け付けていません

UniGen: Universal Domain Generalization for Sentiment Classification via Zero-shot Dataset Generation

要約 事前学習された言語モデルは、プロンプトベースの少数ショット学習により優れた … 続きを読む

カテゴリー: cs.AI, cs.CL | UniGen: Universal Domain Generalization for Sentiment Classification via Zero-shot Dataset Generation はコメントを受け付けていません