cs.CL」カテゴリーアーカイブ

VLM-R1: A Stable and Generalizable R1-style Large Vision-Language Model

要約 最近、Deepseek R1は、補強学習(RL)が、シンプルで効果的なデザ … 続きを読む

カテゴリー: cs.CL, cs.CV | VLM-R1: A Stable and Generalizable R1-style Large Vision-Language Model はコメントを受け付けていません

ConceptFormer: Towards Efficient Use of Knowledge-Graph Embeddings in Large Language Models

要約 検索拡張生成(RAG)は最近の過去に注目を集めており、最近の大規模な言語モ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR | ConceptFormer: Towards Efficient Use of Knowledge-Graph Embeddings in Large Language Models はコメントを受け付けていません

VideoComp: Advancing Fine-Grained Compositional and Temporal Alignment in Video-Text Models

要約 VideoCompは、微調整された時間的アライメントでビジョン言語モデル( … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.IR | VideoComp: Advancing Fine-Grained Compositional and Temporal Alignment in Video-Text Models はコメントを受け付けていません

CollEX — A Multimodal Agentic RAG System Enabling Interactive Exploration of Scientific Collections

要約 このペーパーでは、広範な科学コレクションのインタラクティブな探索を強化する … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.IR | CollEX — A Multimodal Agentic RAG System Enabling Interactive Exploration of Scientific Collections はコメントを受け付けていません

A Graph-Based Synthetic Data Pipeline for Scaling High-Quality Reasoning Instructions

要約 継続的なトレーニングのための高品質の推論データの合成は、大規模な言語モデル … 続きを読む

カテゴリー: cs.CL | A Graph-Based Synthetic Data Pipeline for Scaling High-Quality Reasoning Instructions はコメントを受け付けていません

On the Temporal Question-Answering Capabilities of Large Language Models Over Anonymized Data

要約 トレーニング中に存在しないデータに対する一時的な推論タスクにおける大規模な … 続きを読む

カテゴリー: cs.AI, cs.CL | On the Temporal Question-Answering Capabilities of Large Language Models Over Anonymized Data はコメントを受け付けていません

CLIP meets DINO for Tuning Zero-Shot Classifier using Unlabeled Image Collections

要約 基礎モデルの時代では、Clipは、テキストと視覚モダリティを共通の埋め込み … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | CLIP meets DINO for Tuning Zero-Shot Classifier using Unlabeled Image Collections はコメントを受け付けていません

Unveiling the Impact of Multimodal Features on Chinese Spelling Correction: From Analysis to Design

要約 中国の綴り補正(CSC)タスクは、文のスペルエラーの検出と修正に焦点を当て … 続きを読む

カテゴリー: cs.CL | Unveiling the Impact of Multimodal Features on Chinese Spelling Correction: From Analysis to Design はコメントを受け付けていません

SD-HuBERT: Sentence-Level Self-Distillation Induces Syllabic Organization in HuBERT

要約 スピーチの自己監視学習(SSL)におけるデータ駆動型ユニットの発見は、音声 … 続きを読む

カテゴリー: cs.CL, eess.AS | SD-HuBERT: Sentence-Level Self-Distillation Induces Syllabic Organization in HuBERT はコメントを受け付けていません

Synthetic Fluency: Hallucinations, Confabulations, and the Creation of Irish Words in LLM-Generated Translations

要約 この研究では、アイルランドへの大規模な言語モデル(LLM)翻訳の幻覚を調べ … 続きを読む

カテゴリー: cs.CL | Synthetic Fluency: Hallucinations, Confabulations, and the Creation of Irish Words in LLM-Generated Translations はコメントを受け付けていません