cs.CL」カテゴリーアーカイブ

VLABench: A Large-Scale Benchmark for Language-Conditioned Robotics Manipulation with Long-Horizon Reasoning Tasks

要約 汎用の身体エージェントは、ユーザーの自然な指示や意図を理解し、普遍的なタス … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.RO | VLABench: A Large-Scale Benchmark for Language-Conditioned Robotics Manipulation with Long-Horizon Reasoning Tasks はコメントを受け付けていません

Investigating Large Language Models for Code Vulnerability Detection: An Experimental Study

要約 コード脆弱性検出 (CVD) は、システム セキュリティの問題に対処して防 … 続きを読む

カテゴリー: cs.CL | Investigating Large Language Models for Code Vulnerability Detection: An Experimental Study はコメントを受け付けていません

GenAI Content Detection Task 2: AI vs. Human — Academic Essay Authenticity Challenge

要約 このペーパーでは、COLING 2025 と併置された GenAI コンテ … 続きを読む

カテゴリー: 68T50, cs.AI, cs.CL, F.2.2 | GenAI Content Detection Task 2: AI vs. Human — Academic Essay Authenticity Challenge はコメントを受け付けていません

DeepCRCEval: Revisiting the Evaluation of Code Review Comment Generation

要約 コード レビューはソフトウェア開発において不可欠ですが要求の厳しい側面であ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SE | DeepCRCEval: Revisiting the Evaluation of Code Review Comment Generation はコメントを受け付けていません

GPTEval: A Survey on Assessments of ChatGPT and GPT-4

要約 ChatGPT の出現により、社会および経済システムを混乱させる可能性につ … 続きを読む

カテゴリー: cs.AI, cs.CL | GPTEval: A Survey on Assessments of ChatGPT and GPT-4 はコメントを受け付けていません

Re-examining learning linear functions in context

要約 インコンテキスト学習 (ICL) は、大規模言語モデル (LLM) をさま … 続きを読む

カテゴリー: cs.CL, cs.LG | Re-examining learning linear functions in context はコメントを受け付けていません

M-Ped: Multi-Prompt Ensemble Decoding for Large Language Models

要約 自然言語処理 (NLP) の分野で大規模言語モデル (LLM) が広く適用 … 続きを読む

カテゴリー: cs.AI, cs.CL | M-Ped: Multi-Prompt Ensemble Decoding for Large Language Models はコメントを受け付けていません

Listening to Patients: A Framework of Detecting and Mitigating Patient Misreport for Medical Dialogue Generation

要約 Medical Dialogue System は、患者とエージェントの会 … 続きを読む

カテゴリー: cs.CL | Listening to Patients: A Framework of Detecting and Mitigating Patient Misreport for Medical Dialogue Generation はコメントを受け付けていません

XRAG: eXamining the Core — Benchmarking Foundational Components in Advanced Retrieval-Augmented Generation

要約 検索拡張生成 (RAG) は、関連データの検索と大規模言語モデル (LLM … 続きを読む

カテゴリー: cs.AI, cs.CL | XRAG: eXamining the Core — Benchmarking Foundational Components in Advanced Retrieval-Augmented Generation はコメントを受け付けていません

Exploring Facets of Language Generation in the Limit

要約 Kleinberg と Mullainathan の最近の研究 [KM24 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.DS, cs.LG | Exploring Facets of Language Generation in the Limit はコメントを受け付けていません