投稿者「jarxiv」のアーカイブ

Adding Chocolate to Mint: Mitigating Metric Interference in Machine Translation

要約 自動メトリックがますます強くなり、広く採用されるにつれて、モデル開発中に意 … 続きを読む

カテゴリー: cs.AI, cs.CL | コメントする

SPARE: Single-Pass Annotation with Reference-Guided Evaluation for Automatic Process Supervision and Reward Modelling

要約 プロセスまたは段階的な監督は、大規模な言語モデル(LLM)の複雑なマルチス … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | コメントする

KANITE: Kolmogorov-Arnold Networks for ITE estimation

要約 因果推論における複数の治療設定の下で、個々の治療効果(ITE)の推定のため … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ME | コメントする

Over-squashing in Spatiotemporal Graph Neural Networks

要約 グラフニューラルネットワーク(GNNS)は、さまざまなドメインで顕著な成功 … 続きを読む

カテゴリー: cs.AI, cs.LG | コメントする

M3-JEPA: Multimodal Alignment via Multi-gate MoE based on the Joint-Embedding Predictive Architecture

要約 現在のマルチモーダル学習戦略は、主に元のトークンスペースで最適化しています … 続きを読む

カテゴリー: cs.AI, cs.LG | コメントする

Optimizing Web-Based AI Query Retrieval with GPT Integration in LangChain A CoT-Enhanced Prompt Engineering Approach

要約 大規模な言語モデルは、教育活動の他の側面の中でも、リモート学習学生のプロセ … 続きを読む

カテゴリー: cs.AI, cs.HC | コメントする

RePCS: Diagnosing Data Memorization in LLM-Powered Retrieval-Augmented Generation

要約 検索された生成(RAG)は、現在の外部情報を使用して、大規模な言語モデル( … 続きを読む

カテゴリー: cs.AI, cs.LG | コメントする

RadioRAG: Online Retrieval-augmented Generation for Radiology Question Answering

要約 大規模な言語モデル(LLM)は、静的トレーニングデータセットに基づいて、時 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | コメントする

Pap2Pat: Benchmarking Outline-Guided Long-Text Patent Generation with Patent-Paper Pairs

要約 長くて非常に複雑な技術テキストを扱うことは、大規模な言語モデル(LLMS) … 続きを読む

カテゴリー: cs.AI, cs.CL | コメントする

Capturing Polysemanticity with PRISM: A Multi-Concept Feature Description Framework

要約 自動化された解釈可能性の研究は、モデル行動の人間の理解を高めるために、ニュ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | コメントする