cs.CL」カテゴリーアーカイブ

Kimi-Audio Technical Report

要約 オーディオの理解、生成、会話に優れたオープンソースオーディオファンデーショ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.MM, cs.SD, eess.AS | Kimi-Audio Technical Report はコメントを受け付けていません

MeTHanol: Modularized Thinking Language Models with Intermediate Layer Thinking, Decoding and Bootstrapping Reasoning

要約 大規模な言語モデルは、人間の表現を合理的に理解し、生成することができますが … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | MeTHanol: Modularized Thinking Language Models with Intermediate Layer Thinking, Decoding and Bootstrapping Reasoning はコメントを受け付けていません

Reason Like a Radiologist: Chain-of-Thought and Reinforcement Learning for Verifiable Report Generation

要約 放射線科レポートの生成は効率に重要ですが、現在のモデルには専門家の構造化さ … 続きを読む

カテゴリー: cs.AI, cs.CL | Reason Like a Radiologist: Chain-of-Thought and Reinforcement Learning for Verifiable Report Generation はコメントを受け付けていません

ElChat: Adapting Chat Language Models Using Only Target Unlabeled Language Data

要約 語彙拡張(VE)は、新しいトークンを追加し、ターゲットデータの事前トレーニ … 続きを読む

カテゴリー: cs.AI, cs.CL | ElChat: Adapting Chat Language Models Using Only Target Unlabeled Language Data はコメントを受け付けていません

TextTIGER: Text-based Intelligent Generation with Entity Prompt Refinement for Text-to-Image Generation

要約 特定のエンティティを含むプロンプトから画像を生成するには、モデルができるだ … 続きを読む

カテゴリー: cs.CL, cs.CV | TextTIGER: Text-based Intelligent Generation with Entity Prompt Refinement for Text-to-Image Generation はコメントを受け付けていません

Fast-Slow Thinking for Large Vision-Language Model Reasoning

要約 大規模なビジョン言語モデル(LVLMS)の最近の進歩により、\ texti … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Fast-Slow Thinking for Large Vision-Language Model Reasoning はコメントを受け付けていません

DeepDistill: Enhancing LLM Reasoning Capabilities via Large-Scale Difficulty-Graded Data Training

要約 大規模な言語モデル(LLM)は最近、さまざまな複雑な推論ベンチマークで顕著 … 続きを読む

カテゴリー: cs.CL | DeepDistill: Enhancing LLM Reasoning Capabilities via Large-Scale Difficulty-Graded Data Training はコメントを受け付けていません

Data-Driven Calibration of Prediction Sets in Large Vision-Language Models Based on Inductive Conformal Prediction

要約 この研究では、スプリットコンフォーマル予測(SCP)フレームワークを介した … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Data-Driven Calibration of Prediction Sets in Large Vision-Language Models Based on Inductive Conformal Prediction はコメントを受け付けていません

TimeSoccer: An End-to-End Multimodal Large Language Model for Soccer Commentary Generation

要約 サッカーは世界的に人気のあるスポーツイベントであり、通常、長い試合と特徴的 … 続きを読む

カテゴリー: cs.CL, cs.CV | TimeSoccer: An End-to-End Multimodal Large Language Model for Soccer Commentary Generation はコメントを受け付けていません

Cross-lingual, Character-Level Neural Morphological Tagging

要約 一般的なNLPタスクであっても、多くの言語で十分な監督は利用できません。形 … 続きを読む

カテゴリー: cs.CL | Cross-lingual, Character-Level Neural Morphological Tagging はコメントを受け付けていません