cs.CL」カテゴリーアーカイブ

A is for Absorption: Studying Feature Splitting and Absorption in Sparse Autoencoders

要約 スパース オートエンコーダ (SAE) は、大規模言語モデル (LLM) … 続きを読む

カテゴリー: cs.AI, cs.CL | A is for Absorption: Studying Feature Splitting and Absorption in Sparse Autoencoders はコメントを受け付けていません

Towards Enhancing Linked Data Retrieval in Conversational UIs using Large Language Models

要約 最近、さまざまなドメインで大規模言語モデル (LLM) が広く採用されてい … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR | Towards Enhancing Linked Data Retrieval in Conversational UIs using Large Language Models はコメントを受け付けていません

Can We Count on LLMs? The Fixed-Effect Fallacy and Claims of GPT-4 Capabilities

要約 このペーパーでは、LLM 機能の評価について検討します。 いくつかの決定論 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Can We Count on LLMs? The Fixed-Effect Fallacy and Claims of GPT-4 Capabilities はコメントを受け付けていません

HA-FGOVD: Highlighting Fine-grained Attributes via Explicit Linear Composition for Open-Vocabulary Object Detection

要約 オープン語彙オブジェクト検出 (OVD) モデルは、その広範なトレーニング … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | HA-FGOVD: Highlighting Fine-grained Attributes via Explicit Linear Composition for Open-Vocabulary Object Detection はコメントを受け付けていません

OmniBench: Towards The Future of Universal Omni-Language Models

要約 マルチモーダル大規模言語モデル (MLLM) の最近の進歩は、多様なモダリ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | OmniBench: Towards The Future of Universal Omni-Language Models はコメントを受け付けていません

A Controlled Study on Long Context Extension and Generalization in LLMs

要約 広範なテキストの理解とコンテキスト内の学習には、完全なドキュメントのコンテ … 続きを読む

カテゴリー: cs.CL, cs.LG | A Controlled Study on Long Context Extension and Generalization in LLMs はコメントを受け付けていません

Autoregressive + Chain of Thought = Recurrent: Recurrence’s Role in Language Models’ Computability and a Revisit of Recurrent Transformer

要約 Transformer アーキテクチャは、さまざまな言語モデリング タスク … 続きを読む

カテゴリー: cs.AI, cs.CL | Autoregressive + Chain of Thought = Recurrent: Recurrence’s Role in Language Models’ Computability and a Revisit of Recurrent Transformer はコメントを受け付けていません

Contextual Breach: Assessing the Robustness of Transformer-based QA Models

要約 コンテキスト質問応答モデルは、現実世界のシナリオで一般的に観察される、入力 … 続きを読む

カテゴリー: cs.CL | Contextual Breach: Assessing the Robustness of Transformer-based QA Models はコメントを受け付けていません

ExtractGPT: Exploring the Potential of Large Language Models for Product Attribute Value Extraction

要約 電子商取引プラットフォームでは、ファセット製品検索や属性ベースの製品比較な … 続きを読む

カテゴリー: cs.CL | ExtractGPT: Exploring the Potential of Large Language Models for Product Attribute Value Extraction はコメントを受け付けていません

Gender Representation and Bias in Indian Civil Service Mock Interviews

要約 この論文は 3 つの重要な貢献をしています。 まず、インドの公務員候補者の … 続きを読む

カテゴリー: cs.CL, cs.CY | Gender Representation and Bias in Indian Civil Service Mock Interviews はコメントを受け付けていません