cs.CL」カテゴリーアーカイブ

DeepMath-103K: A Large-Scale, Challenging, Decontaminated, and Verifiable Mathematical Dataset for Advancing Reasoning

要約 複雑な数学的推論の能力は、人工知能の重要なベンチマークです。 LLMSに適 … 続きを読む

カテゴリー: cs.AI, cs.CL | DeepMath-103K: A Large-Scale, Challenging, Decontaminated, and Verifiable Mathematical Dataset for Advancing Reasoning はコメントを受け付けていません

UI-E2I-Synth: Advancing GUI Grounding with Large-Scale Instruction Synthesis

要約 大規模なビジョン言語モデルの最近の進歩は、デジタルデバイスの生産性を高める … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.HC | UI-E2I-Synth: Advancing GUI Grounding with Large-Scale Instruction Synthesis はコメントを受け付けていません

Breaking the Data Barrier — Building GUI Agents Through Task Generalization

要約 グラフィカルユーザーインターフェイス(GUI)エージェントは、生産性ワーク … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Breaking the Data Barrier — Building GUI Agents Through Task Generalization はコメントを受け付けていません

TADACap: Time-series Adaptive Domain-Aware Captioning

要約 画像キャプションは大きな注目を集めていますが、金融やヘルスケアなどの分野で … 続きを読む

カテゴリー: cs.CL, cs.CV | TADACap: Time-series Adaptive Domain-Aware Captioning はコメントを受け付けていません

MultiLoKo: a multilingual local knowledge benchmark for LLMs spanning 31 languages

要約 31の言語をカバーするLLMSの多言語性を評価するための新しいベンチマーク … 続きを読む

カテゴリー: cs.CL | MultiLoKo: a multilingual local knowledge benchmark for LLMs spanning 31 languages はコメントを受け付けていません

GUI-R1 : A Generalist R1-Style Vision-Language Action Model For GUI Agents

要約 グラフィカルユーザーインターフェイス(GUI)エージェントの構築における既 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.HC | GUI-R1 : A Generalist R1-Style Vision-Language Action Model For GUI Agents はコメントを受け付けていません

VisualPuzzles: Decoupling Multimodal Reasoning Evaluation from Domain Knowledge

要約 現在のマルチモーダルベンチマークは、多くの場合、推論とドメイン固有の知識を … 続きを読む

カテゴリー: cs.CL | VisualPuzzles: Decoupling Multimodal Reasoning Evaluation from Domain Knowledge はコメントを受け付けていません

Unchecked and Overlooked: Addressing the Checkbox Blind Spot in Large Language Models with CheckboxQA

要約 チェックボックスは、ダニの有無がデータの抽出と意思決定プロセスを直接通知す … 続きを読む

カテゴリー: cs.CL | Unchecked and Overlooked: Addressing the Checkbox Blind Spot in Large Language Models with CheckboxQA はコメントを受け付けていません

Joint Action Language Modelling for Transparent Policy Execution

要約 エージェントの意図は、具体化されたポリシーのブラックボックスの性質の背後に … 続きを読む

カテゴリー: cs.CL, cs.RO | Joint Action Language Modelling for Transparent Policy Execution はコメントを受け付けていません

TRA: Better Length Generalisation with Threshold Relative Attention

要約 トランスは長さの一般化に苦しんでおり、基本的なタスクでもパフォーマンスが低 … 続きを読む

カテゴリー: cs.CL, cs.LG | TRA: Better Length Generalisation with Threshold Relative Attention はコメントを受け付けていません