月別アーカイブ: 2025年1月

MedHallBench: A New Benchmark for Assessing Hallucination in Medical Large Language Models

要約 医療大規模言語モデル(MLLM)は、医療アプリケーションにおいて潜在的な可 … 続きを読む

カテゴリー: cs.AI, cs.CL | MedHallBench: A New Benchmark for Assessing Hallucination in Medical Large Language Models はコメントを受け付けていません

(WhyPHI) Fine-Tuning PHI-3 for Multiple-Choice Question Answering: Methodology, Results, and Challenges

要約 大規模言語モデル(LLM)は、人間のようなテキストを理解し、生成する優れた … 続きを読む

カテゴリー: cs.AI, cs.CL | (WhyPHI) Fine-Tuning PHI-3 for Multiple-Choice Question Answering: Methodology, Results, and Challenges はコメントを受け付けていません

PSYCHE: A Multi-faceted Patient Simulation Framework for Evaluation of Psychiatric Assessment Conversational Agents

要約 近年の大規模言語モデル(LLM)の進歩により、人間のような応答を生成できる … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | PSYCHE: A Multi-faceted Patient Simulation Framework for Evaluation of Psychiatric Assessment Conversational Agents はコメントを受け付けていません

Qwen2.5 Technical Report

要約 本稿では、多様なニーズに対応するために設計された包括的な大規模言語モデル( … 続きを読む

カテゴリー: cs.CL | Qwen2.5 Technical Report はコメントを受け付けていません

Enhancing LLM Reasoning with Multi-Path Collaborative Reactive and Reflection agents

要約 エージェントは、大規模な言語モデルを通じて、科学的推論タスクにおいてその可 … 続きを読む

カテゴリー: cs.CL | Enhancing LLM Reasoning with Multi-Path Collaborative Reactive and Reflection agents はコメントを受け付けていません

Evaluating Large Language Models on Spatial Tasks: A Multi-Task Benchmarking Study

要約 ChatGPTやGeminiなどの大規模な言語モデルの出現は、自然言語理解 … 続きを読む

カテゴリー: cs.CL, cs.CY | Evaluating Large Language Models on Spatial Tasks: A Multi-Task Benchmarking Study はコメントを受け付けていません

KaLM-Embedding: Superior Training Data Brings A Stronger Embedding Model

要約 大規模な言語モデルにおいて検索を考慮した生成が主流になるにつれ、埋め込みモ … 続きを読む

カテゴリー: cs.CL | KaLM-Embedding: Superior Training Data Brings A Stronger Embedding Model はコメントを受け付けていません

ICPC: In-context Prompt Compression with Faster Inference

要約 近年の大規模言語モデル(LLM)の成功にもかかわらず、LLMの入力サイズは … 続きを読む

カテゴリー: cs.AI, cs.CL | ICPC: In-context Prompt Compression with Faster Inference はコメントを受け付けていません

GS-KGC: A Generative Subgraph-based Framework for Knowledge Graph Completion with Large Language Models

要約 知識グラフ補完(KGC)は、知識グラフ(KG)中の欠損トリプルを特定するこ … 続きを読む

カテゴリー: cs.AI, cs.CL | GS-KGC: A Generative Subgraph-based Framework for Knowledge Graph Completion with Large Language Models はコメントを受け付けていません

Crossing Language Borders: A Pipeline for Indonesian Manhwa Translation

要約 このプロジェクトでは、インドネシア語から英語へのマンファ翻訳を自動化するた … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | Crossing Language Borders: A Pipeline for Indonesian Manhwa Translation はコメントを受け付けていません