月別アーカイブ: 2025年1月

MedHallBench: A New Benchmark for Assessing Hallucination in Medical Large Language Models

投稿日: 2025年1月6日作成者: jarxiv

要約医療大規模言語モデル(MLLM)は、医療アプリケーションにおいて潜在的な可 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

(WhyPHI) Fine-Tuning PHI-3 for Multiple-Choice Question Answering: Methodology, Results, and Challenges

投稿日: 2025年1月6日作成者: jarxiv

要約大規模言語モデル(LLM)は、人間のようなテキストを理解し、生成する優れた … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

PSYCHE: A Multi-faceted Patient Simulation Framework for Evaluation of Psychiatric Assessment Conversational Agents

投稿日: 2025年1月6日作成者: jarxiv

要約近年の大規模言語モデル（LLM）の進歩により、人間のような応答を生成できる … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Qwen2.5 Technical Report

投稿日: 2025年1月6日作成者: jarxiv

要約本稿では、多様なニーズに対応するために設計された包括的な大規模言語モデル（ … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Enhancing LLM Reasoning with Multi-Path Collaborative Reactive and Reflection agents

投稿日: 2025年1月6日作成者: jarxiv

要約エージェントは、大規模な言語モデルを通じて、科学的推論タスクにおいてその可 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Evaluating Large Language Models on Spatial Tasks: A Multi-Task Benchmarking Study

投稿日: 2025年1月6日作成者: jarxiv

要約 ChatGPTやGeminiなどの大規模な言語モデルの出現は、自然言語理解 … 続きを読む →

カテゴリー: cs.CL, cs.CY | コメントを受け付けていません

KaLM-Embedding: Superior Training Data Brings A Stronger Embedding Model

投稿日: 2025年1月6日作成者: jarxiv

要約大規模な言語モデルにおいて検索を考慮した生成が主流になるにつれ、埋め込みモ … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

ICPC: In-context Prompt Compression with Faster Inference

投稿日: 2025年1月6日作成者: jarxiv

要約近年の大規模言語モデル（LLM）の成功にもかかわらず、LLMの入力サイズは … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

GS-KGC: A Generative Subgraph-based Framework for Knowledge Graph Completion with Large Language Models

投稿日: 2025年1月6日作成者: jarxiv

要約知識グラフ補完(KGC)は、知識グラフ(KG)中の欠損トリプルを特定するこ … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Crossing Language Borders: A Pipeline for Indonesian Manhwa Translation

投稿日: 2025年1月6日作成者: jarxiv

要約このプロジェクトでは、インドネシア語から英語へのマンファ翻訳を自動化するた … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG | コメントを受け付けていません

月別アーカイブ: 2025年1月

MedHallBench: A New Benchmark for Assessing Hallucination in Medical Large Language Models

(WhyPHI) Fine-Tuning PHI-3 for Multiple-Choice Question Answering: Methodology, Results, and Challenges

PSYCHE: A Multi-faceted Patient Simulation Framework for Evaluation of Psychiatric Assessment Conversational Agents

Qwen2.5 Technical Report

Enhancing LLM Reasoning with Multi-Path Collaborative Reactive and Reflection agents

Evaluating Large Language Models on Spatial Tasks: A Multi-Task Benchmarking Study

KaLM-Embedding: Superior Training Data Brings A Stronger Embedding Model

ICPC: In-context Prompt Compression with Faster Inference

GS-KGC: A Generative Subgraph-based Framework for Knowledge Graph Completion with Large Language Models

Crossing Language Borders: A Pipeline for Indonesian Manhwa Translation

最近の投稿

最近のコメント

アーカイブ

カテゴリー