cs.CL」カテゴリーアーカイブ

SOPBench: Evaluating Language Agents at Following Standard Operating Procedures and Constraints

要約 言語エージェントが重要なタスクをますます自動化するにつれて、ドメイン固有の … 続きを読む

カテゴリー: cs.AI, cs.CL | SOPBench: Evaluating Language Agents at Following Standard Operating Procedures and Constraints はコメントを受け付けていません

Controllable and Reliable Knowledge-Intensive Task-Oriented Conversational Agents with Declarative Genie Worksheets

要約 大規模な言語モデルは、タスクと知識のユーザー要求に応答して、さまざまな設定 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.PL | Controllable and Reliable Knowledge-Intensive Task-Oriented Conversational Agents with Declarative Genie Worksheets はコメントを受け付けていません

From Bytes to Ideas: Language Modeling with Autoregressive U-Nets

要約 トークン化は、入力テキストに固定された粒度を課し、言語モデルがデータでどの … 続きを読む

カテゴリー: cs.AI, cs.CL | From Bytes to Ideas: Language Modeling with Autoregressive U-Nets はコメントを受け付けていません

A Variational Framework for Improving Naturalness in Generative Spoken Language Models

要約 テキスト処理における大規模な言語モデルの成功により、音声モデリングへの適応 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SD, eess.AS | A Variational Framework for Improving Naturalness in Generative Spoken Language Models はコメントを受け付けていません

Chain-of-Thought Reasoning In The Wild Is Not Always Faithful

要約 チェーンオブシャーチ(COT)の推論は、最先端のAI機能を大幅に進めていま … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Chain-of-Thought Reasoning In The Wild Is Not Always Faithful はコメントを受け付けていません

Navigating the Digital World as Humans Do: Universal Visual Grounding for GUI Agents

要約 マルチモーダル大手言語モデル(MLLMS)は、グラフィカルユーザーインター … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Navigating the Digital World as Humans Do: Universal Visual Grounding for GUI Agents はコメントを受け付けていません

VisText-Mosquito: A Multimodal Dataset and Benchmark for AI-Based Mosquito Breeding Site Detection and Reasoning

要約 蚊媒介性疾患は、大規模な世界的な健康リスクをもたらし、発生を防ぐために繁殖 … 続きを読む

カテゴリー: cs.CL, cs.CV | VisText-Mosquito: A Multimodal Dataset and Benchmark for AI-Based Mosquito Breeding Site Detection and Reasoning はコメントを受け付けていません

ONEBench to Test Them All: Sample-Level Benchmarking Over Open-Ended Capabilities

要約 従来の固定テストセットは、基礎モデルのオープンエンド機能の評価に不足してい … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | ONEBench to Test Them All: Sample-Level Benchmarking Over Open-Ended Capabilities はコメントを受け付けていません

FigCaps-HF: A Figure-to-Caption Generative Framework and Benchmark with Human Feedback

要約 科学的な視覚化と文書を理解するには、キャプションが重要です。 科学者向けの … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | FigCaps-HF: A Figure-to-Caption Generative Framework and Benchmark with Human Feedback はコメントを受け付けていません

Language and Planning in Robotic Navigation: A Multilingual Evaluation of State-of-the-Art Models

要約 GPT-4などの大規模な言語モデル(LLM)は、複数のドメインにまたがる膨 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | Language and Planning in Robotic Navigation: A Multilingual Evaluation of State-of-the-Art Models はコメントを受け付けていません