cs.CL」カテゴリーアーカイブ

Large Language Model Enhanced Clustering for News Event Detection

要約 ニュースの状況は常に進化しており、世界中からの情報量が増え続けています。 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Large Language Model Enhanced Clustering for News Event Detection はコメントを受け付けていません

APIGen: Automated Pipeline for Generating Verifiable and Diverse Function-Calling Datasets

要約 関数呼び出しエージェント モデルの進歩には、多様で信頼性の高い高品質のデー … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SE | APIGen: Automated Pipeline for Generating Verifiable and Diverse Function-Calling Datasets はコメントを受け付けていません

Symbolic Learning Enables Self-Evolving Agents

要約 AI コミュニティは、プロンプト手法とツール使用方法の両方を含む複雑な大規 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Symbolic Learning Enables Self-Evolving Agents はコメントを受け付けていません

Jina CLIP: Your CLIP Model Is Also Your Text Retriever

要約 Contrastive Language-Image Pretrainin … 続きを読む

カテゴリー: 68T50, cs.AI, cs.CL, cs.CV, cs.IR, I.2.7 | Jina CLIP: Your CLIP Model Is Also Your Text Retriever はコメントを受け付けていません

CharXiv: Charting Gaps in Realistic Chart Understanding in Multimodal LLMs

要約 科学論文や財務レポートの分析など、現実世界のタスクにマルチモーダル大規模言 … 続きを読む

カテゴリー: cs.CL, cs.CV | CharXiv: Charting Gaps in Realistic Chart Understanding in Multimodal LLMs はコメントを受け付けていません

ChronoMagic-Bench: A Benchmark for Metamorphic Evaluation of Text-to-Time-lapse Video Generation

要約 私たちは、タイムラプスビデオ生成における T2V モデル (Sora や … 続きを読む

カテゴリー: cs.CL, cs.CV | ChronoMagic-Bench: A Benchmark for Metamorphic Evaluation of Text-to-Time-lapse Video Generation はコメントを受け付けていません

Situational Awareness Matters in 3D Vision Language Reasoning

要約 3D 空間で複雑な視覚言語推論タスクを実行できることは、家庭用ロボットや人 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Situational Awareness Matters in 3D Vision Language Reasoning はコメントを受け付けていません

Large Language Models in the Clinic: A Comprehensive Benchmark

要約 臨床医を支援するための大規模言語モデル (LLM) の採用は、注目を集めて … 続きを読む

カテゴリー: cs.AI, cs.CL | Large Language Models in the Clinic: A Comprehensive Benchmark はコメントを受け付けていません

LongIns: A Challenging Long-context Instruction-based Exam for LLMs

要約 大規模言語モデル (LLM) のロングコンテキスト機能は、近年大きな話題に … 続きを読む

カテゴリー: cs.CL | LongIns: A Challenging Long-context Instruction-based Exam for LLMs はコメントを受け付けていません

VarBench: Robust Language Model Benchmarking Through Dynamic Variable Perturbation

要約 大規模な言語モデルが従来のベンチマークで優れたスコアを達成するにつれて、一 … 続きを読む

カテゴリー: cs.CL | VarBench: Robust Language Model Benchmarking Through Dynamic Variable Perturbation はコメントを受け付けていません