投稿者「jarxiv」のアーカイブ

Can Vision-Language Models Evaluate Handwritten Math?

要約 視覚言語モデル (VLM) の最近の進歩により、特に数学において、生徒の手 … 続きを読む

カテゴリー: cs.CL, cs.CV | コメントする

Audio-CoT: Exploring Chain-of-Thought Reasoning in Large Audio Language Model

要約 Large Audio-Language Model (LALM) は、音 … 続きを読む

カテゴリー: cs.CL, cs.MM, cs.SD, eess.AS | コメントする

Comparative analysis of optical character recognition methods for Sámi texts from the National Library of Norway

要約 光学式文字認識 (OCR) は、スキャンされた文書を機械可読テキストに変換 … 続きを読む

カテゴリー: cs.CL, cs.CV | コメントする

Don’t Command, Cultivate: An Exploratory Study of System-2 Alignment

要約 o1 システム カードは、o1 モデルが OpenAI 内で最も堅牢である … 続きを読む

カテゴリー: cs.CL | コメントする

FinerWeb-10BT: Refining Web Data with LLM-Based Line-Level Filtering

要約 大規模言語モデル (LLM) をトレーニングするには、データ品質が非常に重 … 続きを読む

カテゴリー: cs.CL | コメントする

Joint Automatic Speech Recognition And Structure Learning For Better Speech Understanding

要約 音声言語理解 (SLU) は、音声の分野における構造予測タスクです。 最近 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | コメントする

Eradicating Social Biases in Sentiment Analysis using Semantic Blinding and Semantic Propagation Graph Neural Networks

要約 この論文では、構文構造と単語レベルの感情的手がかりのみに依存してテキスト内 … 続きを読む

カテゴリー: cs.CL | コメントする

Are queries and keys always relevant? A case study on Transformer wave functions

要約 ドット積アテンション メカニズムは、もともと自然言語処理タスク用に設計され … 続きを読む

カテゴリー: cond-mat.dis-nn, cs.CL, physics.comp-ph | コメントする

Controlling Equational Reasoning in Large Language Models with Prompt Interventions

要約 この論文では、大規模言語モデル (LLM) における幻覚率が記号データ生成 … 続きを読む

カテゴリー: cs.CL, math.HO | コメントする

Investigating Large Language Models in Inferring Personality Traits from User Conversations

要約 大規模言語モデル (LLM) は、心理的評価を含むさまざまな領域にわたって … 続きを読む

カテゴリー: cs.CL | コメントする