月別アーカイブ: 2025年2月

Adaptive Knowledge Graphs Enhance Medical Question Answering: Bridging the Gap Between LLMs and Evolving Medical Knowledge

要約 大規模な言語モデル(LLM)は、広範な臨床データと医学文献を活用することに … 続きを読む

カテゴリー: cs.CL, cs.MA | Adaptive Knowledge Graphs Enhance Medical Question Answering: Bridging the Gap Between LLMs and Evolving Medical Knowledge はコメントを受け付けていません

Towards a Design Guideline for RPA Evaluation: A Survey of Large Language Model-Based Role-Playing Agents

要約 ロールプレイングエージェント(RPA)は、さまざまなタスクで人間のような行 … 続きを読む

カテゴリー: cs.CL, cs.HC | Towards a Design Guideline for RPA Evaluation: A Survey of Large Language Model-Based Role-Playing Agents はコメントを受け付けていません

Oreo: A Plug-in Context Reconstructor to Enhance Retrieval-Augmented Generation

要約 さまざまなNLPタスクにおける大規模な言語モデル(LLM)の顕著な能力にも … 続きを読む

カテゴリー: cs.CL | Oreo: A Plug-in Context Reconstructor to Enhance Retrieval-Augmented Generation はコメントを受け付けていません

Towards Human Understanding of Paraphrase Types in Large Language Models

要約 言い換えは、さまざまな方法で提示された表現を理解する人間の直感的な能力を表 … 続きを読む

カテゴリー: cs.CL, I.2.7 | Towards Human Understanding of Paraphrase Types in Large Language Models はコメントを受け付けていません

Whose story is it? Personalizing story generation by inferring author styles

要約 パーソナライズは、インタラクティブなライティングおよび教育アプリケーション … 続きを読む

カテゴリー: cs.CL | Whose story is it? Personalizing story generation by inferring author styles はコメントを受け付けていません

HPSS: Heuristic Prompting Strategy Search for LLM Evaluators

要約 テキスト評価のための大規模な言語モデル(LLMS)の採用は、自然言語加工( … 続きを読む

カテゴリー: cs.CL | HPSS: Heuristic Prompting Strategy Search for LLM Evaluators はコメントを受け付けていません

Thoughts Are All Over the Place: On the Underthinking of o1-Like LLMs

要約 OpenaiのO1などの大規模な言語モデル(LLM)は、テスト時間の計算を … 続きを読む

カテゴリー: cs.CL | Thoughts Are All Over the Place: On the Underthinking of o1-Like LLMs はコメントを受け付けていません

Do we still need Human Annotators? Prompting Large Language Models for Aspect Sentiment Quad Prediction

要約 Aspect Sentiment Quadruple Prediction … 続きを読む

カテゴリー: cs.CL | Do we still need Human Annotators? Prompting Large Language Models for Aspect Sentiment Quad Prediction はコメントを受け付けていません

AEIA-MN: Evaluating the Robustness of Multimodal LLM-Powered Mobile Agents Against Active Environmental Injection Attacks

要約 研究者がAIエージェントを継続的に最適化して、オペレーティングシステム内で … 続きを読む

カテゴリー: cs.CL | AEIA-MN: Evaluating the Robustness of Multimodal LLM-Powered Mobile Agents Against Active Environmental Injection Attacks はコメントを受け付けていません

SimpleVQA: Multimodal Factuality Evaluation for Multimodal Large Language Models

要約 さまざまなセクターにわたるマルチモーダル大手言語モデル(MLLM)の適用の … 続きを読む

カテゴリー: cs.CL | SimpleVQA: Multimodal Factuality Evaluation for Multimodal Large Language Models はコメントを受け付けていません