投稿者「jarxiv」のアーカイブ

Research on the Online Update Method for Retrieval-Augmented Generation (RAG) Model with Incremental Learning

要約 情報技術の急速な進歩とデータ量の急激な増加という現代の状況において、言語モ … 続きを読む

カテゴリー: cs.CL, cs.IR | Research on the Online Update Method for Retrieval-Augmented Generation (RAG) Model with Incremental Learning はコメントを受け付けていません

Boosting Text-To-Image Generation via Multilingual Prompting in Large Multimodal Models

要約 テキストから画像へ (T2I) 生成のための大規模マルチモーダル モデル … 続きを読む

カテゴリー: cs.CL | Boosting Text-To-Image Generation via Multilingual Prompting in Large Multimodal Models はコメントを受け付けていません

Critical Tokens Matter: Token-Level Contrastive Estimation Enhances LLM’s Reasoning Capability

要約 数学的推論タスクは、正確な論理演繹とシーケンス分析を必要とするため、大規模 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Critical Tokens Matter: Token-Level Contrastive Estimation Enhances LLM’s Reasoning Capability はコメントを受け付けていません

AdaCS: Adaptive Normalization for Enhanced Code-Switching ASR

要約 センテンシャル内コードスイッチング (CS) は、単一の発話内で発生する言 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | AdaCS: Adaptive Normalization for Enhanced Code-Switching ASR はコメントを受け付けていません

MIO: A Foundation Model on Multimodal Tokens

要約 このペーパーでは、エンドツーエンドの自己回帰方式で音声、テキスト、画像、ビ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | MIO: A Foundation Model on Multimodal Tokens はコメントを受け付けていません

ListConRanker: A Contrastive Text Reranker with Listwise Encoding

要約 リランカー モデルは、指定されたクエリとパッセージの間のセマンティクスの類 … 続きを読む

カテゴリー: cs.CL, cs.IR | ListConRanker: A Contrastive Text Reranker with Listwise Encoding はコメントを受け付けていません

Quilt-LLaVA: Visual Instruction Tuning by Extracting Localized Narratives from Open-Source Histopathology Videos

要約 組織病理学における診断には、グローバルな全スライド画像 (WSI) 解析が … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Quilt-LLaVA: Visual Instruction Tuning by Extracting Localized Narratives from Open-Source Histopathology Videos はコメントを受け付けていません

II-Bench: An Image Implication Understanding Benchmark for Multimodal Large Language Models

要約 マルチモーダル大規模言語モデル (MLLM) の開発における急速な進歩によ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | II-Bench: An Image Implication Understanding Benchmark for Multimodal Large Language Models はコメントを受け付けていません

BIOMEDICA: An Open Biomedical Image-Caption Archive, Dataset, and Vision-Language Models Derived from Scientific Literature

要約 ビジョン言語モデル (VLM) の開発は、大規模で多様なマルチモーダル デ … 続きを読む

カテゴリー: cs.CL, cs.CV | BIOMEDICA: An Open Biomedical Image-Caption Archive, Dataset, and Vision-Language Models Derived from Scientific Literature はコメントを受け付けていません

Assessment and manipulation of latent constructs in pre-trained language models using psychometric scales

要約 最近、人間に似た性格特性が大規模な言語モデルで発見され、その(既知だがまだ … 続きを読む

カテゴリー: cs.AI, cs.CL | Assessment and manipulation of latent constructs in pre-trained language models using psychometric scales はコメントを受け付けていません