cs.CL」カテゴリーアーカイブ

Task Memory Engine (TME): A Structured Memory Framework with Graph-Aware Extensions for Multi-Step LLM Agent Tasks

要約 大規模な言語モデル(LLM)は、マルチステップタスクの自律エージェントとし … 続きを読む

カテゴリー: 68T05, cs.AI, cs.CL, H.3.3 | Task Memory Engine (TME): A Structured Memory Framework with Graph-Aware Extensions for Multi-Step LLM Agent Tasks はコメントを受け付けていません

Large language models could be rote learners

要約 複数選択の質問(MCQ)ベンチマークは、大規模な言語モデル(LLM)の評価 … 続きを読む

カテゴリー: cs.AI, cs.CL | Large language models could be rote learners はコメントを受け付けていません

Out of Style: RAG’s Fragility to Linguistic Variation

要約 さまざまなNLPベンチマークにわたる検索された生成(RAG)システムの印象 … 続きを読む

カテゴリー: cs.CL | Out of Style: RAG’s Fragility to Linguistic Variation はコメントを受け付けていません

Humanity’s Last Exam

要約 ベンチマークは、大規模な言語モデル(LLM)機能の急速な進歩を追跡するため … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Humanity’s Last Exam はコメントを受け付けていません

IFShip: Interpretable Fine-grained Ship Classification with Domain Knowledge-Enhanced Vision-Language Models

要約 エンドツーエンドの解釈は、現在、リモートセンシングの細粒船分類(RS-FG … 続きを読む

カテゴリー: cs.CL | IFShip: Interpretable Fine-grained Ship Classification with Domain Knowledge-Enhanced Vision-Language Models はコメントを受け付けていません

Millions of States: Designing a Scalable MoE Architecture with RWKV-7 Meta-learner

要約 RWKV-7のような状態ベースのシーケンスモデルは、変圧器アーキテクチャの … 続きを読む

カテゴリー: cs.CL, cs.LG | Millions of States: Designing a Scalable MoE Architecture with RWKV-7 Meta-learner はコメントを受け付けていません

MathSpeech: Leveraging Small LMs for Accurate Conversion in Mathematical Speech-to-Formula

要約 数学の講義や研究プレゼンテーションなどのさまざまな学術的および専門的な設定 … 続きを読む

カテゴリー: cs.AI, cs.CL | MathSpeech: Leveraging Small LMs for Accurate Conversion in Mathematical Speech-to-Formula はコメントを受け付けていません

EmbodiedEval: Evaluate Multimodal LLMs as Embodied Agents

要約 マルチモーダル大手言語モデル(MLLM)は大きな進歩を示しており、具体化さ … 続きを読む

カテゴリー: cs.CL, cs.CV | EmbodiedEval: Evaluate Multimodal LLMs as Embodied Agents はコメントを受け付けていません

Evaluating the Bias in LLMs for Surveying Opinion and Decision Making in Healthcare

要約 生成エージェントは、大規模な言語モデル(LLM)によって駆動される、シリコ … 続きを読む

カテゴリー: cs.CL | Evaluating the Bias in LLMs for Surveying Opinion and Decision Making in Healthcare はコメントを受け付けていません

VLMT: Vision-Language Multimodal Transformer for Multimodal Multi-hop Question Answering

要約 テキスト、テーブル、画像間のマルチモーダルデータの可用性の向上は、複雑なク … 続きを読む

カテゴリー: cs.CL, cs.CV | VLMT: Vision-Language Multimodal Transformer for Multimodal Multi-hop Question Answering はコメントを受け付けていません