「cs.CL」カテゴリーアーカイブ

Inducing Generalization across Languages and Tasks using Featurized Low-Rank Mixtures

投稿日: 2024年8月2日作成者: jarxiv

要約事前トレーニングされた大規模言語モデル (LLM) を数十または数百の人間 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

DefInt: A Default-interventionist Framework for Efficient Reasoning with Hybrid Large Language Models

投稿日: 2024年8月2日作成者: jarxiv

要約大規模言語モデル (LLM) は、幅広いタスクにおいて優れた創発的能力を示 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

GLiNER multi-task: Generalist Lightweight Model for Various Information Extraction Tasks

投稿日: 2024年8月2日作成者: jarxiv

要約情報抽出タスクには、正確かつ効率的で一般化可能なモデルの両方が必要です。 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.IR, cs.LG | コメントを受け付けていません

A Hybrid Intelligence Method for Argument Mining

投稿日: 2024年8月2日作成者: jarxiv

要約大規模な調査ツールを使用すると、意見コーパスとして市民のフィードバックを収 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.HC | コメントを受け付けていません

The opportunities and risks of large language models in mental health

投稿日: 2024年8月2日作成者: jarxiv

要約メンタルヘルスの懸念の割合は世界的に上昇しており、メンタルヘルスケアの既存 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CY, cs.HC, cs.LG | コメントを受け付けていません

A Notion of Complexity for Theory of Mind via Discrete World Models

投稿日: 2024年8月2日作成者: jarxiv

要約 Theory of Mind (ToM) は、社会的推論が必要な複雑なシナ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Predicting the Geolocation of Tweets Using transformer models on Customized Data

投稿日: 2024年8月2日作成者: jarxiv

要約この研究は、ツイート/ユーザーの地理位置予測タスクを解決し、テキストビッグ … 続きを読む →

カテゴリー: 68T50, cs.AI, cs.CL, I.2.7 | コメントを受け付けていません

The Impact of Quantization on Retrieval-Augmented Generation: An Analysis of Small LLMs

投稿日: 2024年8月2日作成者: jarxiv

要約トレーニング後の量子化により、大規模言語モデル (LLM) の計算需要が軽 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.IR | コメントを受け付けていません

On Pre-training of Multimodal Language Models Customized for Chart Understanding

投稿日: 2024年8月2日作成者: jarxiv

要約ドメイン固有のタスク向けにマルチモーダル大規模言語モデル (MLLM) を … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

SynthVLM: High-Efficiency and High-Quality Synthetic Data for Vision Language Models

投稿日: 2024年8月2日作成者: jarxiv

要約最近、Web 画像の台頭により、大規模な画像データセットの管理と理解の重要 … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

Inducing Generalization across Languages and Tasks using Featurized Low-Rank Mixtures

DefInt: A Default-interventionist Framework for Efficient Reasoning with Hybrid Large Language Models

GLiNER multi-task: Generalist Lightweight Model for Various Information Extraction Tasks

A Hybrid Intelligence Method for Argument Mining

The opportunities and risks of large language models in mental health

A Notion of Complexity for Theory of Mind via Discrete World Models

Predicting the Geolocation of Tweets Using transformer models on Customized Data

The Impact of Quantization on Retrieval-Augmented Generation: An Analysis of Small LLMs

On Pre-training of Multimodal Language Models Customized for Chart Understanding

SynthVLM: High-Efficiency and High-Quality Synthetic Data for Vision Language Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー