「cs.CL」カテゴリーアーカイブ

The Expressive Power of Transformers with Chain of Thought

投稿日: 2024年3月21日作成者: jarxiv

要約最近の理論的研究により、グラフ内の 2 つのノードが接続されているかどうか … 続きを読む →

カテゴリー: cs.CC, cs.CL, cs.LG, cs.LO | コメントを受け付けていません

What if…?: Counterfactual Inception to Mitigate Hallucination Effects in Large Multimodal Models

投稿日: 2024年3月21日作成者: jarxiv

要約この論文では、モデルが誤った応答または無関係な応答を生成する幻覚効果に対処 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

Motion Generation from Fine-grained Textual Descriptions

投稿日: 2024年3月21日作成者: jarxiv

要約 text2motion のタスクは、与えられたテキストの説明からモーション … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.RO | コメントを受け付けていません

What explains the success of cross-modal fine-tuning with ORCA?

投稿日: 2024年3月21日作成者: jarxiv

要約 ORCA (Shen et al.、2023) は、クロスモーダル微調整の … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Do Language Models Know When They’re Hallucinating References?

投稿日: 2024年3月21日作成者: jarxiv

要約最先端の言語モデル (LM) は、幻覚情報を生成しやすいことで知られていま … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

PARAMANU-AYN: An Efficient Novel Generative and Instruction-tuned Language Model for Indian Legal Case Documents

投稿日: 2024年3月21日作成者: jarxiv

要約この論文では、インド最高裁判所の判例文書、インド憲法、インド刑法のみに基づ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

AutoMix: Automatically Mixing Language Models

投稿日: 2024年3月21日作成者: jarxiv

要約大規模言語モデル (LLM) は、さまざまなサイズと構成でクラウド API … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Having Beer after Prayer? Measuring Cultural Bias in Large Language Models

投稿日: 2024年3月21日作成者: jarxiv

要約大規模言語モデル (LM) の範囲が世界的に拡大するにつれて、多様な文化的 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Information-Theoretic Distillation for Reference-less Summarization

投稿日: 2024年3月21日作成者: jarxiv

要約現在の自動要約の勝利レシピは、ChatGPT などの独自の大規模言語モデル … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Reverse Training to Nurse the Reversal Curse

投稿日: 2024年3月21日作成者: jarxiv

要約大規模言語モデル (LLM) には驚くべき失敗があります。「A には特徴 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

The Expressive Power of Transformers with Chain of Thought

What if…?: Counterfactual Inception to Mitigate Hallucination Effects in Large Multimodal Models

Motion Generation from Fine-grained Textual Descriptions

What explains the success of cross-modal fine-tuning with ORCA?

Do Language Models Know When They’re Hallucinating References?

PARAMANU-AYN: An Efficient Novel Generative and Instruction-tuned Language Model for Indian Legal Case Documents

AutoMix: Automatically Mixing Language Models

Having Beer after Prayer? Measuring Cultural Bias in Large Language Models

Information-Theoretic Distillation for Reference-less Summarization

Reverse Training to Nurse the Reversal Curse

最近の投稿

最近のコメント

アーカイブ

カテゴリー