cs.CL」カテゴリーアーカイブ

Web2Code: A Large-scale Webpage-to-Code Dataset and Evaluation Framework for Multimodal LLMs

要約 マルチモーダル大規模言語モデル (MLLM) は、さまざまな理解および生成 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Web2Code: A Large-scale Webpage-to-Code Dataset and Evaluation Framework for Multimodal LLMs はコメントを受け付けていません

RuBLiMP: Russian Benchmark of Linguistic Minimal Pairs

要約 最小ペアは、言語モデルの文法知識を評価するための確立されたアプローチです。 … 続きを読む

カテゴリー: cs.CL | RuBLiMP: Russian Benchmark of Linguistic Minimal Pairs はコメントを受け付けていません

FlowVQA: Mapping Multimodal Logic in Visual Question Answering with Flowcharts

要約 視覚的な質問に答える既存のベンチマークには、特に空間推論スキルの評価におい … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.IR, cs.LG | FlowVQA: Mapping Multimodal Logic in Visual Question Answering with Flowcharts はコメントを受け付けていません

AI Hospital: Benchmarking Large Language Models in a Multi-agent Medical Interaction Simulator

要約 人工知能は、特に医療質問応答ベンチマークで優れた大規模言語モデル (LLM … 続きを読む

カテゴリー: cs.CL | AI Hospital: Benchmarking Large Language Models in a Multi-agent Medical Interaction Simulator はコメントを受け付けていません

RoboUniView: Visual-Language Model with Unified View Representation for Robotic Manipulaiton

要約 ロボット操作に視覚言語モデル (VLM) を利用することは、新しいパラダイ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.RO | RoboUniView: Visual-Language Model with Unified View Representation for Robotic Manipulaiton はコメントを受け付けていません

The Illusion of Competence: Evaluating the Effect of Explanations on Users’ Mental Models of Visual Question Answering Systems

要約 AI システムが完璧に実行できないタスクに遭遇したときに、ユーザーがその限 … 続きを読む

カテゴリー: cs.CL | The Illusion of Competence: Evaluating the Effect of Explanations on Users’ Mental Models of Visual Question Answering Systems はコメントを受け付けていません

Annotation Errors and NER: A Study with OntoNotes 5.0

要約 固有表現認識 (NER) は、NLP でよく研究されている問題です。 ただ … 続きを読む

カテゴリー: cs.CL | Annotation Errors and NER: A Study with OntoNotes 5.0 はコメントを受け付けていません

How to Handle Different Types of Out-of-Distribution Scenarios in Computational Argumentation? A Comprehensive and Fine-Grained Field Study

要約 事前トレーニング済み言語モデル (LM) の出現により、自然言語処理は著し … 続きを読む

カテゴリー: cs.CL | How to Handle Different Types of Out-of-Distribution Scenarios in Computational Argumentation? A Comprehensive and Fine-Grained Field Study はコメントを受け付けていません

QUB-Cirdan at ‘Discharge Me!’: Zero shot discharge letter generation by open-source LLM

要約 BioNLP ACL’24 の退院文書の合理化に関する共有タス … 続きを読む

カテゴリー: cs.CL | QUB-Cirdan at ‘Discharge Me!’: Zero shot discharge letter generation by open-source LLM はコメントを受け付けていません

SeaKR: Self-aware Knowledge Retrieval for Adaptive Retrieval Augmented Generation

要約 この論文では、LLM の内部状態から自己認識の不確実性を抽出する新しい適応 … 続きを読む

カテゴリー: cs.CL | SeaKR: Self-aware Knowledge Retrieval for Adaptive Retrieval Augmented Generation はコメントを受け付けていません