cs.CL」カテゴリーアーカイブ

The Expressive Power of Transformers with Chain of Thought

要約 最近の理論的研究により、グラフ内の 2 つのノードが接続されているかどうか … 続きを読む

カテゴリー: cs.CC, cs.CL, cs.LG, cs.LO | The Expressive Power of Transformers with Chain of Thought はコメントを受け付けていません

What if…?: Counterfactual Inception to Mitigate Hallucination Effects in Large Multimodal Models

要約 この論文では、モデルが誤った応答または無関係な応答を生成する幻覚効果に対処 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | What if…?: Counterfactual Inception to Mitigate Hallucination Effects in Large Multimodal Models はコメントを受け付けていません

Motion Generation from Fine-grained Textual Descriptions

要約 text2motion のタスクは、与えられたテキストの説明からモーション … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.RO | Motion Generation from Fine-grained Textual Descriptions はコメントを受け付けていません

What explains the success of cross-modal fine-tuning with ORCA?

要約 ORCA (Shen et al.、2023) は、クロスモーダル微調整の … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | What explains the success of cross-modal fine-tuning with ORCA? はコメントを受け付けていません

Do Language Models Know When They’re Hallucinating References?

要約 最先端の言語モデル (LM) は、幻覚情報を生成しやすいことで知られていま … 続きを読む

カテゴリー: cs.AI, cs.CL | Do Language Models Know When They’re Hallucinating References? はコメントを受け付けていません

PARAMANU-AYN: An Efficient Novel Generative and Instruction-tuned Language Model for Indian Legal Case Documents

要約 この論文では、インド最高裁判所の判例文書、インド憲法、インド刑法のみに基づ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | PARAMANU-AYN: An Efficient Novel Generative and Instruction-tuned Language Model for Indian Legal Case Documents はコメントを受け付けていません

AutoMix: Automatically Mixing Language Models

要約 大規模言語モデル (LLM) は、さまざまなサイズと構成でクラウド API … 続きを読む

カテゴリー: cs.AI, cs.CL | AutoMix: Automatically Mixing Language Models はコメントを受け付けていません

Having Beer after Prayer? Measuring Cultural Bias in Large Language Models

要約 大規模言語モデル (LM) の範囲が世界的に拡大するにつれて、多様な文化的 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Having Beer after Prayer? Measuring Cultural Bias in Large Language Models はコメントを受け付けていません

Information-Theoretic Distillation for Reference-less Summarization

要約 現在の自動要約の勝利レシピは、ChatGPT などの独自の大規模言語モデル … 続きを読む

カテゴリー: cs.AI, cs.CL | Information-Theoretic Distillation for Reference-less Summarization はコメントを受け付けていません

Reverse Training to Nurse the Reversal Curse

要約 大規模言語モデル (LLM) には驚くべき失敗があります。「A には特徴 … 続きを読む

カテゴリー: cs.AI, cs.CL | Reverse Training to Nurse the Reversal Curse はコメントを受け付けていません