cs.CL」カテゴリーアーカイブ

LLM-SRBench: A New Benchmark for Scientific Equation Discovery with Large Language Models

要約 科学方程式の発見は、科学的進歩の歴史の基本的な課題であり、自然現象を管理す … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | LLM-SRBench: A New Benchmark for Scientific Equation Discovery with Large Language Models はコメントを受け付けていません

Can We Edit LLMs for Long-Tail Biomedical Knowledge?

要約 知識編集は、内部知識を変更することにより、大規模な言語モデル(LLMS)を … 続きを読む

カテゴリー: cs.AI, cs.CL | Can We Edit LLMs for Long-Tail Biomedical Knowledge? はコメントを受け付けていません

LLM Can be a Dangerous Persuader: Empirical Study of Persuasion Safety in Large Language Models

要約 大規模な言語モデル(LLM)の最近の進歩により、人間レベルの説得能力にアプ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.HC | LLM Can be a Dangerous Persuader: Empirical Study of Persuasion Safety in Large Language Models はコメントを受け付けていません

VLM-R1: A Stable and Generalizable R1-style Large Vision-Language Model

要約 最近、Deepseek R1は、補強学習(RL)が、シンプルで効果的なデザ … 続きを読む

カテゴリー: cs.CL, cs.CV | VLM-R1: A Stable and Generalizable R1-style Large Vision-Language Model はコメントを受け付けていません

Multimodal Long Video Modeling Based on Temporal Dynamic Context

要約 大規模な言語モデル(LLMS)の最近の進歩により、ビデオ理解の大きなブレー … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | Multimodal Long Video Modeling Based on Temporal Dynamic Context はコメントを受け付けていません

Learning Free Token Reduction for Multi-Modal Large Language Models

要約 ビジョン言語モデル(VLM)は、さまざまなマルチモーダルタスクで顕著な成功 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Learning Free Token Reduction for Multi-Modal Large Language Models はコメントを受け付けていません

RealWebAssist: A Benchmark for Long-Horizon Web Assistance with Real-World Users

要約 長老のWebベースのタスクで成功した支援を達成するには、AIエージェントは … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | RealWebAssist: A Benchmark for Long-Horizon Web Assistance with Real-World Users はコメントを受け付けていません

GUI-R1 : A Generalist R1-Style Vision-Language Action Model For GUI Agents

要約 グラフィカルユーザーインターフェイス(GUI)エージェントの構築における既 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.HC | GUI-R1 : A Generalist R1-Style Vision-Language Action Model For GUI Agents はコメントを受け付けていません

MIEB: Massive Image Embedding Benchmark

要約 画像表現は、多くの場合、見返りのあるタスク固有のプロトコルによって評価され … 続きを読む

カテゴリー: cs.CL, cs.CV | MIEB: Massive Image Embedding Benchmark はコメントを受け付けていません

Analyzing 16,193 LLM Papers for Fun and Profits

要約 大規模な言語モデル(LLM)は、コンピューターサイエンスの研究の景観を再構 … 続きを読む

カテゴリー: cs.CL, cs.DL | Analyzing 16,193 LLM Papers for Fun and Profits はコメントを受け付けていません