「cs.CL」カテゴリーアーカイブ

SOPBench: Evaluating Language Agents at Following Standard Operating Procedures and Constraints

投稿日: 2025年6月18日作成者: jarxiv

要約言語エージェントが重要なタスクをますます自動化するにつれて、ドメイン固有の … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Controllable and Reliable Knowledge-Intensive Task-Oriented Conversational Agents with Declarative Genie Worksheets

投稿日: 2025年6月18日作成者: jarxiv

要約大規模な言語モデルは、タスクと知識のユーザー要求に応答して、さまざまな設定 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.PL | コメントを受け付けていません

From Bytes to Ideas: Language Modeling with Autoregressive U-Nets

投稿日: 2025年6月18日作成者: jarxiv

要約トークン化は、入力テキストに固定された粒度を課し、言語モデルがデータでどの … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

A Variational Framework for Improving Naturalness in Generative Spoken Language Models

投稿日: 2025年6月18日作成者: jarxiv

要約テキスト処理における大規模な言語モデルの成功により、音声モデリングへの適応 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Chain-of-Thought Reasoning In The Wild Is Not Always Faithful

投稿日: 2025年6月18日作成者: jarxiv

要約チェーンオブシャーチ（COT）の推論は、最先端のAI機能を大幅に進めていま … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Navigating the Digital World as Humans Do: Universal Visual Grounding for GUI Agents

投稿日: 2025年6月18日作成者: jarxiv

要約マルチモーダル大手言語モデル（MLLMS）は、グラフィカルユーザーインター … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

VisText-Mosquito: A Multimodal Dataset and Benchmark for AI-Based Mosquito Breeding Site Detection and Reasoning

投稿日: 2025年6月18日作成者: jarxiv

要約蚊媒介性疾患は、大規模な世界的な健康リスクをもたらし、発生を防ぐために繁殖 … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

ONEBench to Test Them All: Sample-Level Benchmarking Over Open-Ended Capabilities

投稿日: 2025年6月18日作成者: jarxiv

要約従来の固定テストセットは、基礎モデルのオープンエンド機能の評価に不足してい … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG | コメントを受け付けていません

FigCaps-HF: A Figure-to-Caption Generative Framework and Benchmark with Human Feedback

投稿日: 2025年6月18日作成者: jarxiv

要約科学的な視覚化と文書を理解するには、キャプションが重要です。科学者向けの … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Language and Planning in Robotic Navigation: A Multilingual Evaluation of State-of-the-Art Models

投稿日: 2025年6月18日作成者: jarxiv

要約 GPT-4などの大規模な言語モデル（LLM）は、複数のドメインにまたがる膨 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

SOPBench: Evaluating Language Agents at Following Standard Operating Procedures and Constraints

Controllable and Reliable Knowledge-Intensive Task-Oriented Conversational Agents with Declarative Genie Worksheets

From Bytes to Ideas: Language Modeling with Autoregressive U-Nets

A Variational Framework for Improving Naturalness in Generative Spoken Language Models

Chain-of-Thought Reasoning In The Wild Is Not Always Faithful

Navigating the Digital World as Humans Do: Universal Visual Grounding for GUI Agents

VisText-Mosquito: A Multimodal Dataset and Benchmark for AI-Based Mosquito Breeding Site Detection and Reasoning

ONEBench to Test Them All: Sample-Level Benchmarking Over Open-Ended Capabilities

FigCaps-HF: A Figure-to-Caption Generative Framework and Benchmark with Human Feedback

Language and Planning in Robotic Navigation: A Multilingual Evaluation of State-of-the-Art Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー