cs.CL」カテゴリーアーカイブ

UniMS-RAG: A Unified Multi-source Retrieval-Augmented Generation for Personalized Dialogue Systems

要約 大規模言語モデル (LLM) は、多くの自然言語の理解および生成タスクにお … 続きを読む

カテゴリー: cs.AI, cs.CL | UniMS-RAG: A Unified Multi-source Retrieval-Augmented Generation for Personalized Dialogue Systems はコメントを受け付けていません

Can LLMs be Good Graph Judger for Knowledge Graph Construction?

要約 実際のシナリオでは、情報検索 (IR) システムから取得されるデータのほと … 続きを読む

カテゴリー: cs.AI, cs.CL | Can LLMs be Good Graph Judger for Knowledge Graph Construction? はコメントを受け付けていません

RSL-SQL: Robust Schema Linking in Text-to-SQL Generation

要約 Text-to-SQL 生成は、自然言語の質問を SQL ステートメントに … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.DB | RSL-SQL: Robust Schema Linking in Text-to-SQL Generation はコメントを受け付けていません

A Survey on Multimodal Large Language Models

要約 最近、GPT-4V に代表されるマルチモーダル大規模言語モデル (MLLM … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | A Survey on Multimodal Large Language Models はコメントを受け付けていません

ShowUI: One Vision-Language-Action Model for GUI Visual Agent

要約 グラフィカル ユーザー インターフェイス (GUI) アシスタントの構築は … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.HC | ShowUI: One Vision-Language-Action Model for GUI Visual Agent はコメントを受け付けていません

Automatic Album Sequencing

要約 アルバムの順序付けは、アルバム制作プロセスの重要な部分です。 最近、コレク … 続きを読む

カテゴリー: 68T07, cs.AI, cs.CL, cs.LG, cs.MM, cs.SD, eess.AS, I.2.6 | Automatic Album Sequencing はコメントを受け付けていません

What Differentiates Educational Literature? A Multimodal Fusion Approach of Transformers and Computational Linguistics

要約 教育者には読みやすさを迅速に評価し、教室の多様なニーズに合わせてテキストを … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | What Differentiates Educational Literature? A Multimodal Fusion Approach of Transformers and Computational Linguistics はコメントを受け付けていません

Evaluating Tokenizer Performance of Large Language Models Across Official Indian Languages

要約 トランスフォーマー アーキテクチャに基づく大規模言語モデル (LLM) は … 続きを読む

カテゴリー: cs.AI, cs.CL | Evaluating Tokenizer Performance of Large Language Models Across Official Indian Languages はコメントを受け付けていません

Natural Language Understanding and Inference with MLLM in Visual Question Answering: A Survey

要約 Visual Question Answering (VQA) は、自然言 … 続きを読む

カテゴリー: cs.CL, cs.CV | Natural Language Understanding and Inference with MLLM in Visual Question Answering: A Survey はコメントを受け付けていません

LLM2CLIP: Powerful Language Model Unlocks Richer Visual Representation

要約 CLIP は、大規模な画像とテキストのペアに対する対照学習を使用して、画像 … 続きを読む

カテゴリー: cs.CL, cs.CV | LLM2CLIP: Powerful Language Model Unlocks Richer Visual Representation はコメントを受け付けていません