月別アーカイブ: 2025年2月

BioMaze: Benchmarking and Enhancing Large Language Models for Biological Pathway Reasoning

要約 さまざまな生物学的領域における大規模な言語モデル(LLM)の応用が最近検討 … 続きを読む

カテゴリー: cs.AI, cs.LG, q-bio.QM | BioMaze: Benchmarking and Enhancing Large Language Models for Biological Pathway Reasoning はコメントを受け付けていません

LeanProgress: Guiding Search for Neural Theorem Proving via Proof Progress Prediction

要約 数学的推論は、幻覚のために大規模な言語モデル(LLMS)にとって重要な課題 … 続きを読む

カテゴリー: cs.AI | LeanProgress: Guiding Search for Neural Theorem Proving via Proof Progress Prediction はコメントを受け付けていません

An exploration of features to improve the generalisability of fake news detection models

要約 偽のニュースは、選挙に影響を与え、誤った情報を広め、検出を重要にすることに … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | An exploration of features to improve the generalisability of fake news detection models はコメントを受け付けていません

EAIRA: Establishing a Methodology for Evaluating AI Models as Scientific Research Assistants

要約 最近の進歩により、AI、特に大規模な言語モデル(LLMS)が科学的研究のた … 続きを読む

カテゴリー: cs.AI | EAIRA: Establishing a Methodology for Evaluating AI Models as Scientific Research Assistants はコメントを受け付けていません

Building reliable sim driving agents by scaling self-play

要約 シミュレーションエージェントは、自律車両(AVS)などの人間と相互作用する … 続きを読む

カテゴリー: cs.AI, cs.RO | Building reliable sim driving agents by scaling self-play はコメントを受け付けていません

LangProBe: a Language Programs Benchmark

要約 言語モデル(LMS)をマルチステップ言語プログラムに作成し、モジュラープロ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR, cs.LG | LangProBe: a Language Programs Benchmark はコメントを受け付けていません

Mixture of Structural-and-Textual Retrieval over Text-rich Graph Knowledge Bases

要約 テキストが豊富なグラフ知識ベース(TG​​-KBS)は、テキストおよび構造 … 続きを読む

カテゴリー: cs.AI, cs.IR, cs.LG | Mixture of Structural-and-Textual Retrieval over Text-rich Graph Knowledge Bases はコメントを受け付けていません

Logicbreaks: A Framework for Understanding Subversion of Rule-based Inference

要約 私たちは、次の迅速な指定ルールから大規模な言語モデル(LLMS)を破壊する … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG | Logicbreaks: A Framework for Understanding Subversion of Rule-based Inference はコメントを受け付けていません

Deep Reinforcement Learning based Autonomous Decision-Making for Cooperative UAVs: A Search and Rescue Real World Application

要約 このペーパーでは、グローバルナビゲーション衛星システム(GNSS)デニード … 続きを読む

カテゴリー: cs.AI, cs.RO | Deep Reinforcement Learning based Autonomous Decision-Making for Cooperative UAVs: A Search and Rescue Real World Application はコメントを受け付けていません

Emergent Symbolic Mechanisms Support Abstract Reasoning in Large Language Models

要約 最近の多くの研究では、大規模な言語モデルにおける緊急の推論能力の証拠が発見 … 続きを読む

カテゴリー: cs.AI, cs.CL | Emergent Symbolic Mechanisms Support Abstract Reasoning in Large Language Models はコメントを受け付けていません