cs.CL」カテゴリーアーカイブ

The Polar Express: Optimal Matrix Sign Methods and Their Application to the Muon Algorithm

要約 極座標分解とそれに関連する行列符号関数の計算は、数値解析において数十年にわ … 続きを読む

カテゴリー: 65F30, 68N19, 68T07, cs.AI, cs.CL, cs.LG, cs.NA, F.2.1, math.NA, math.OC | The Polar Express: Optimal Matrix Sign Methods and Their Application to the Muon Algorithm はコメントを受け付けていません

Retrieval-Augmented Generation as Noisy In-Context Learning: A Unified Theory and Risk Bounds

要約 検索支援型生成(RAG)は、外部知識を用いてLLMを支援することで、近年多 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR, cs.LG, math.ST, stat.TH | Retrieval-Augmented Generation as Noisy In-Context Learning: A Unified Theory and Risk Bounds はコメントを受け付けていません

Critique-GRPO: Advancing LLM Reasoning with Natural Language and Numerical Feedback

要約 スカラー報酬のような数値フィードバックを用いた強化学習(RL)の最近の進歩 … 続きを読む

カテゴリー: cs.AI, cs.CL | Critique-GRPO: Advancing LLM Reasoning with Natural Language and Numerical Feedback はコメントを受け付けていません

Entity-Augmented Neuroscience Knowledge Retrieval Using Ontology and Semantic Understanding Capability of LLM

要約 神経科学の研究論文は、膨大な知識の宝庫です。既存の情報を正確に検索し、この … 続きを読む

カテゴリー: cs.AI, cs.CL | Entity-Augmented Neuroscience Knowledge Retrieval Using Ontology and Semantic Understanding Capability of LLM はコメントを受け付けていません

Causal Estimation of Tokenisation Bias

要約 現代の言語モデルは通常、サブワード列に対して学習されるが、最終的には文字列 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Causal Estimation of Tokenisation Bias はコメントを受け付けていません

We Should Chart an Atlas of All the World’s Models

要約 公開モデルリポジトリには、現在数百万ものモデルが含まれていますが、ほとんど … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | We Should Chart an Atlas of All the World’s Models はコメントを受け付けていません

Can’t See the Forest for the Trees: Benchmarking Multimodal Safety Awareness for Multimodal LLMs

要約 マルチモーダル大規模言語モデル(MLLM)は、テキストと画像の両方を介した … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | Can’t See the Forest for the Trees: Benchmarking Multimodal Safety Awareness for Multimodal LLMs はコメントを受け付けていません

Chain-of-Jailbreak Attack for Image Generation Models via Editing Step by Step

要約 Stable Diffusion や DALL-E 3 のようなテキストベ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.CV, cs.MM | Chain-of-Jailbreak Attack for Image Generation Models via Editing Step by Step はコメントを受け付けていません

OmniSpatial: Towards Comprehensive Spatial Reasoning Benchmark for Vision Language Models

要約 空間推論は認知心理学の重要な側面であり、現在の視覚言語モデル(VLM)の大 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | OmniSpatial: Towards Comprehensive Spatial Reasoning Benchmark for Vision Language Models はコメントを受け付けていません

GUI-Actor: Coordinate-Free Visual Grounding for GUI Agents

要約 VLMを搭載したGUIエージェントを構築する際の主な課題の1つは、視覚的グ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | GUI-Actor: Coordinate-Free Visual Grounding for GUI Agents はコメントを受け付けていません