投稿者「jarxiv」のアーカイブ

SUMO: Subspace-Aware Moment-Orthogonalization for Accelerating Memory-Efficient LLM Training

要約 低ランクの勾配ベースの最適化方法により、大規模な言語モデル(LLM)のトレ … 続きを読む

カテゴリー: cs.CL, cs.LG, math.OC | SUMO: Subspace-Aware Moment-Orthogonalization for Accelerating Memory-Efficient LLM Training はコメントを受け付けていません

LGAR: Zero-Shot LLM-Guided Neural Ranking for Abstract Screening in Systematic Literature Reviews

要約 科学文献は急速に成長しており、最先端を追跡するのが難しくなっています。 体 … 続きを読む

カテゴリー: cs.CL | LGAR: Zero-Shot LLM-Guided Neural Ranking for Abstract Screening in Systematic Literature Reviews はコメントを受け付けていません

From Macro to Micro: Probing Dataset Diversity in Language Model Fine-Tuning

要約 データセットの多様性は、特に大規模な言語モデル(LLM)開発の監視付き微調 … 続きを読む

カテゴリー: cs.CL | From Macro to Micro: Probing Dataset Diversity in Language Model Fine-Tuning はコメントを受け付けていません

MAGIC-VQA: Multimodal And Grounded Inference with Commonsense Knowledge for Visual Question Answering

要約 視覚的な質問応答(VQA)には視覚的およびテキストのモダリティ全体の推論が … 続きを読む

カテゴリー: cs.CL | MAGIC-VQA: Multimodal And Grounded Inference with Commonsense Knowledge for Visual Question Answering はコメントを受け付けていません

Contrastive Learning for Task-Independent SpeechLLM-Pretraining

要約 大規模な言語モデル(LLM)は自然言語処理に優れていますが、これらのLLM … 続きを読む

カテゴリー: cs.CL, cs.HC | Contrastive Learning for Task-Independent SpeechLLM-Pretraining はコメントを受け付けていません

Revisiting Epistemic Markers in Confidence Estimation: Can Markers Accurately Reflect Large Language Models’ Uncertainty?

要約 大規模な言語モデル(LLM)がハイステークスドメインでますます使用されてい … 続きを読む

カテゴリー: cs.CL | Revisiting Epistemic Markers in Confidence Estimation: Can Markers Accurately Reflect Large Language Models’ Uncertainty? はコメントを受け付けていません

ToolCoder: A Systematic Code-Empowered Tool Learning Framework for Large Language Models

要約 ツール学習は、大規模な言語モデル(LLM)が外部ツールとの相互作用を通じて … 続きを読む

カテゴリー: cs.CL | ToolCoder: A Systematic Code-Empowered Tool Learning Framework for Large Language Models はコメントを受け付けていません

Addressing Blind Guessing: Calibration of Selection Bias in Multiple-Choice Question Answering by Video Language Models

要約 ビデオ言語モデル(VLMS)の評価は困難な作業です。 その透明性のため、多 … 続きを読む

カテゴリー: cs.CL | Addressing Blind Guessing: Calibration of Selection Bias in Multiple-Choice Question Answering by Video Language Models はコメントを受け付けていません

Guiding Generative Storytelling with Knowledge Graphs

要約 大規模な言語モデル(LLM)は、自動化されたストーリー生成に大きな可能性を … 続きを読む

カテゴリー: cs.CL, cs.HC | Guiding Generative Storytelling with Knowledge Graphs はコメントを受け付けていません

Mitigating Subgroup Disparities in Multi-Label Speech Emotion Recognition: A Pseudo-Labeling and Unsupervised Learning Approach

要約 サブグループの格差とパフォーマンスバイアスは計算研究でますます研究されてい … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Mitigating Subgroup Disparities in Multi-Label Speech Emotion Recognition: A Pseudo-Labeling and Unsupervised Learning Approach はコメントを受け付けていません