cs.CL」カテゴリーアーカイブ

Inducing Generalization across Languages and Tasks using Featurized Low-Rank Mixtures

要約 事前トレーニングされた大規模言語モデル (LLM) を数十または数百の人間 … 続きを読む

カテゴリー: cs.AI, cs.CL | Inducing Generalization across Languages and Tasks using Featurized Low-Rank Mixtures はコメントを受け付けていません

DefInt: A Default-interventionist Framework for Efficient Reasoning with Hybrid Large Language Models

要約 大規模言語モデル (LLM) は、幅広いタスクにおいて優れた創発的能力を示 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | DefInt: A Default-interventionist Framework for Efficient Reasoning with Hybrid Large Language Models はコメントを受け付けていません

GLiNER multi-task: Generalist Lightweight Model for Various Information Extraction Tasks

要約 情報抽出タスクには、正確かつ効率的で一般化可能なモデルの両方が必要です。 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR, cs.LG | GLiNER multi-task: Generalist Lightweight Model for Various Information Extraction Tasks はコメントを受け付けていません

A Hybrid Intelligence Method for Argument Mining

要約 大規模な調査ツールを使用すると、意見コーパスとして市民のフィードバックを収 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.HC | A Hybrid Intelligence Method for Argument Mining はコメントを受け付けていません

The opportunities and risks of large language models in mental health

要約 メンタルヘルスの懸念の割合は世界的に上昇しており、メンタルヘルスケアの既存 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CY, cs.HC, cs.LG | The opportunities and risks of large language models in mental health はコメントを受け付けていません

A Notion of Complexity for Theory of Mind via Discrete World Models

要約 Theory of Mind (ToM) は、社会的推論が必要な複雑なシナ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | A Notion of Complexity for Theory of Mind via Discrete World Models はコメントを受け付けていません

Predicting the Geolocation of Tweets Using transformer models on Customized Data

要約 この研究は、ツイート/ユーザーの地理位置予測タスクを解決し、テキストビッグ … 続きを読む

カテゴリー: 68T50, cs.AI, cs.CL, I.2.7 | Predicting the Geolocation of Tweets Using transformer models on Customized Data はコメントを受け付けていません

The Impact of Quantization on Retrieval-Augmented Generation: An Analysis of Small LLMs

要約 トレーニング後の量子化により、大規模言語モデル (LLM) の計算需要が軽 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR | The Impact of Quantization on Retrieval-Augmented Generation: An Analysis of Small LLMs はコメントを受け付けていません

On Pre-training of Multimodal Language Models Customized for Chart Understanding

要約 ドメイン固有のタスク向けにマルチモーダル大規模言語モデル (MLLM) を … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | On Pre-training of Multimodal Language Models Customized for Chart Understanding はコメントを受け付けていません

SynthVLM: High-Efficiency and High-Quality Synthetic Data for Vision Language Models

要約 最近、Web 画像の台頭により、大規模な画像データセットの管理と理解の重要 … 続きを読む

カテゴリー: cs.CL, cs.CV | SynthVLM: High-Efficiency and High-Quality Synthetic Data for Vision Language Models はコメントを受け付けていません