投稿者「jarxiv」のアーカイブ

Table-Critic: A Multi-Agent Framework for Collaborative Criticism and Refinement in Table Reasoning

要約 さまざまな推論タスクにおける大規模な言語モデル(LLMS)の顕著な能力にも … 続きを読む

カテゴリー: cs.AI, cs.CL | Table-Critic: A Multi-Agent Framework for Collaborative Criticism and Refinement in Table Reasoning はコメントを受け付けていません

Handling Symbolic Language in Student Texts: A Comparative Study of NLP Embedding Models

要約 自然言語加工(NLP)の最近の進歩により、特にNLP埋め込みモデルの使用に … 続きを読む

カテゴリー: cs.AI, cs.CL, physics.ed-ph | Handling Symbolic Language in Student Texts: A Comparative Study of NLP Embedding Models はコメントを受け付けていません

Beyond Distillation: Pushing the Limits of Medical LLM Reasoning with Minimalist Rule-Based RL

要約 複雑なタスクのパフォーマンスを改善し、特に臨床応用のために、大規模な言語モ … 続きを読む

カテゴリー: cs.AI, cs.CL | Beyond Distillation: Pushing the Limits of Medical LLM Reasoning with Minimalist Rule-Based RL はコメントを受け付けていません

Counting Cycles with Deepseek

要約 最近の進歩にもかかわらず、AIはまだ高度な数学に苦労しています。 困難なオ … 続きを読む

カテゴリー: cs.CL | Counting Cycles with Deepseek はコメントを受け付けていません

Are Large Language Models Reliable AI Scientists? Assessing Reverse-Engineering of Black-Box Systems

要約 AIを使用して自律的な研究者を作成することは、科学的発見を加速する可能性が … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Are Large Language Models Reliable AI Scientists? Assessing Reverse-Engineering of Black-Box Systems はコメントを受け付けていません

TAD-Bench: A Comprehensive Benchmark for Embedding-Based Text Anomaly Detection

要約 テキストの異常検出は、自然言語処理タスクにおけるスパム、誤った情報、および … 続きを読む

カテゴリー: cs.AI, cs.CL | TAD-Bench: A Comprehensive Benchmark for Embedding-Based Text Anomaly Detection はコメントを受け付けていません

AVerImaTeC: A Dataset for Automatic Verification of Image-Text Claims with Evidence from the Web

要約 テキストの主張には、多くの場合、その信頼性を高め、ソーシャルメディアでの広 … 続きを読む

カテゴリー: cs.CL | AVerImaTeC: A Dataset for Automatic Verification of Image-Text Claims with Evidence from the Web はコメントを受け付けていません

Retrieval-Augmented Fine-Tuning With Preference Optimization For Visual Program Generation

要約 ビジュアルプログラミング言語(VPL)により、ユーザーはグラフィカルインタ … 続きを読む

カテゴリー: cs.AI, cs.CL | Retrieval-Augmented Fine-Tuning With Preference Optimization For Visual Program Generation はコメントを受け付けていません

The AI Gap: How Socioeconomic Status Affects Language Technology Interactions

要約 社会経済的地位(SES)は、大規模な言語モデル(LLM)のようなデジタルテ … 続きを読む

カテゴリー: cs.CL | The AI Gap: How Socioeconomic Status Affects Language Technology Interactions はコメントを受け付けていません

Towards Analyzing and Understanding the Limitations of VAPO: A Theoretical Perspective

要約 VAPOフレームワークは、大規模な言語モデル(LLM)を使用した長いチェー … 続きを読む

カテゴリー: cs.CL, cs.LG | Towards Analyzing and Understanding the Limitations of VAPO: A Theoretical Perspective はコメントを受け付けていません