投稿者「jarxiv」のアーカイブ

The syntax-semantics interface in a child’s path: A study of 3- to 11-year-olds’ elicited production of Mandarin recursive relative clauses

要約 子供の取得における構文と意味論の関係については、明らかに矛盾した主張が存在 … 続きを読む

カテゴリー: cs.CL | The syntax-semantics interface in a child’s path: A study of 3- to 11-year-olds’ elicited production of Mandarin recursive relative clauses はコメントを受け付けていません

Ladder-residual: parallelism-aware architecture for accelerating large model inference with communication overlapping

要約 大規模な言語モデルの推論はメモリを大量に消費し、時間がかかるため、効率的に … 続きを読む

カテゴリー: cs.CL, cs.DC, cs.LG | Ladder-residual: parallelism-aware architecture for accelerating large model inference with communication overlapping はコメントを受け付けていません

The Impact of Copyrighted Material on Large Language Models: A Norwegian Perspective

要約 言語モデルのトレーニングに著作権で保護された素材を使用すると、法的および倫 … 続きを読む

カテゴリー: cs.CL | The Impact of Copyrighted Material on Large Language Models: A Norwegian Perspective はコメントを受け付けていません

Extend Adversarial Policy Against Neural Machine Translation via Unknown Token

要約 敵対的な例の生成は、主流のニューラル機械翻訳 (NMT) の堅牢性に貢献し … 続きを読む

カテゴリー: cs.CL | Extend Adversarial Policy Against Neural Machine Translation via Unknown Token はコメントを受け付けていません

TDAG: A Multi-Agent Framework based on Dynamic Task Decomposition and Agent Generation

要約 ChatGPT のようなラージ言語モデル (LLM) の出現により、現実世 … 続きを読む

カテゴリー: cs.CL | TDAG: A Multi-Agent Framework based on Dynamic Task Decomposition and Agent Generation はコメントを受け付けていません

Word and Phrase Features in Graph Convolutional Network for Automatic Question Classification

要約 効果的な質問の分類は、AI 主導の教育ツールにとって非常に重要であり、アダ … 続きを読む

カテゴリー: cs.CL | Word and Phrase Features in Graph Convolutional Network for Automatic Question Classification はコメントを受け付けていません

FOCUS: First Order Concentrated Updating Scheme

要約 大規模言語モデル (LLM) は顕著なパフォーマンスを示しており、その事前 … 続きを読む

カテゴリー: cs.CL, cs.LG, math.OC | FOCUS: First Order Concentrated Updating Scheme はコメントを受け付けていません

ReDeEP: Detecting Hallucination in Retrieval-Augmented Generation via Mechanistic Interpretability

要約 検索拡張生成 (RAG) モデルは、外部の知識を組み込むように設計されてお … 続きを読む

カテゴリー: cs.CL | ReDeEP: Detecting Hallucination in Retrieval-Augmented Generation via Mechanistic Interpretability はコメントを受け付けていません

Hire Me or Not? Examining Language Model’s Behavior with Occupation Attributes

要約 大規模言語モデル (LLM) は、さまざまな下流タスクで優れたパフォーマン … 続きを読む

カテゴリー: cs.CL | Hire Me or Not? Examining Language Model’s Behavior with Occupation Attributes はコメントを受け付けていません

Leveraging Explicit Reasoning for Inference Integration in Commonsense-Augmented Dialogue Models

要約 オープンドメインの対話システムは、人間のユーザーを理解し効果的に応答するた … 続きを読む

カテゴリー: cs.CL | Leveraging Explicit Reasoning for Inference Integration in Commonsense-Augmented Dialogue Models はコメントを受け付けていません