投稿者「jarxiv」のアーカイブ

Measuring Data Diversity for Instruction Tuning: A Systematic Analysis and A Reliable Metric

要約 データの多様性は、大規模な言語モデルの指示の調整に重要です。 既存の研究で … 続きを読む

カテゴリー: cs.CL | Measuring Data Diversity for Instruction Tuning: A Systematic Analysis and A Reliable Metric はコメントを受け付けていません

Improving Factuality with Explicit Working Memory

要約 大規模な言語モデルは、幻覚として知られる問題である事実上不正確なコンテンツ … 続きを読む

カテゴリー: cs.CL | Improving Factuality with Explicit Working Memory はコメントを受け付けていません

3MDBench: Medical Multimodal Multi-agent Dialogue Benchmark

要約 大規模なビジョン言語モデル(LVLM)は医学で積極的に調査されていますが、 … 続きを読む

カテゴリー: 68T42, cs.CL, cs.HC, cs.MA, I.2.1 | 3MDBench: Medical Multimodal Multi-agent Dialogue Benchmark はコメントを受け付けていません

Multimodal Conversation Structure Understanding

要約 会話は通常、役割によって構成されます – 誰が話しているか、誰 … 続きを読む

カテゴリー: cs.CL | Multimodal Conversation Structure Understanding はコメントを受け付けていません

Completing A Systematic Review in Hours instead of Months with Interactive AI Agents

要約 体系的なレビュー(SRS)は、ヘルスケアなどの高品質の分野でのエビデンスに … 続きを読む

カテゴリー: cs.CL, cs.HC | Completing A Systematic Review in Hours instead of Months with Interactive AI Agents はコメントを受け付けていません

SwingArena: Competitive Programming Arena for Long-context GitHub Issue Solving

要約 現実世界のソフトウェア開発ワークフローを密接に反映する、大規模な言語モデル … 続きを読む

カテゴリー: cs.CL | SwingArena: Competitive Programming Arena for Long-context GitHub Issue Solving はコメントを受け付けていません

Don’t Push the Button! Exploring Data Leakage Risks in Machine Learning and Transfer Learning

要約 機械学習(ML)はさまざまなドメインに革命をもたらし、いくつかの分野で予測 … 続きを読む

カテゴリー: cs.AI, cs.LG | Don’t Push the Button! Exploring Data Leakage Risks in Machine Learning and Transfer Learning はコメントを受け付けていません

Egocentric Speaker Classification in Child-Adult Dyadic Interactions: From Sensing to Computational Modeling

要約 自閉症スペクトラム障害(ASD)は、社会的コミュニケーション、反復行動、お … 続きを読む

カテゴリー: cs.AI, cs.SD, eess.AS | Egocentric Speaker Classification in Child-Adult Dyadic Interactions: From Sensing to Computational Modeling はコメントを受け付けていません

When LLMs Play the Telephone Game: Cultural Attractors as Conceptual Tools to Evaluate LLMs in Multi-turn Settings

要約 大規模な言語モデル(LLM)が互いに相互作用し、オンラインでよりますます多 … 続きを読む

カテゴリー: 68T50, cs.AI, cs.MA, I.2.7, physics.soc-ph | When LLMs Play the Telephone Game: Cultural Attractors as Conceptual Tools to Evaluate LLMs in Multi-turn Settings はコメントを受け付けていません

Real-time Adapting Routing (RAR): Improving Efficiency Through Continuous Learning in Software Powered by Layered Foundation Models

要約 ファンデーションモデル(FM、大規模言語モデル(LLMS)などのFM)のバ … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.MA | Real-time Adapting Routing (RAR): Improving Efficiency Through Continuous Learning in Software Powered by Layered Foundation Models はコメントを受け付けていません