投稿者「jarxiv」のアーカイブ

Mixture of Weight-shared Heterogeneous Group Attention Experts for Dynamic Token-wise KV Optimization

投稿日: 2025年6月17日作成者: jarxiv

要約トランスモデルは、計算および保管リソースを株するキー価値（kV）キャッシュ … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

EmoDynamiX: Emotional Support Dialogue Strategy Prediction by Modelling MiXed Emotions and Discourse Dynamics

投稿日: 2025年6月17日作成者: jarxiv

要約苦痛を経験している人々に快適さとアドバイスを提供するために、感情的にインテ … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Characterizing Linguistic Shifts in Croatian News via Diachronic Word Embeddings

投稿日: 2025年6月17日作成者: jarxiv

要約単語の意味論が時間の経過とともにどのように変化するかを測定すると、文化と視 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

MiniMax-M1: Scaling Test-Time Compute Efficiently with Lightning Attention

投稿日: 2025年6月17日作成者: jarxiv

要約世界初のオープンウェイトで大規模なハイブリッドアテナンス推論モデルであるM … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Qwen vs. Gemma Integration with Whisper: A Comparative Study in Multilingual SpeechLLM Systems

投稿日: 2025年6月17日作成者: jarxiv

要約このペーパーでは、MLC-SLM Challenge 2025のシステムを … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Idiosyncrasies in Large Language Models

投稿日: 2025年6月17日作成者: jarxiv

要約この作業では、大規模な言語モデル（LLMS）で特異性を発表して研究します。 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Experiential Semantic Information and Brain Alignment: Are Multimodal Models Better than Language Models?

投稿日: 2025年6月17日作成者: jarxiv

要約計算言語学の一般的な仮定は、マルチモーダルモデルによって学んだテキスト表現 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

A Structured Bangla Dataset of Disease-Symptom Associations to Improve Diagnostic Accuracy

投稿日: 2025年6月17日作成者: jarxiv

要約疾病症候群のデータセットは重要であり、医学研究、疾患診断、臨床的意思決定、 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

An Empirical Study of LLM-as-a-Judge: How Design Choices Impact Evaluation Reliability

投稿日: 2025年6月17日作成者: jarxiv

要約大規模な言語モデル（LLMS）が進歩し続けるにつれて、特に自由な指導に従う … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

EvolvTrip: Enhancing Literary Character Understanding with Temporal Theory-of-Mind Graphs

投稿日: 2025年6月17日作成者: jarxiv

要約キャラクターの魅力的な描写は、物語の執筆の成功に不可欠です。読者にとって … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

投稿者「jarxiv」のアーカイブ

Mixture of Weight-shared Heterogeneous Group Attention Experts for Dynamic Token-wise KV Optimization

EmoDynamiX: Emotional Support Dialogue Strategy Prediction by Modelling MiXed Emotions and Discourse Dynamics

Characterizing Linguistic Shifts in Croatian News via Diachronic Word Embeddings

MiniMax-M1: Scaling Test-Time Compute Efficiently with Lightning Attention

Qwen vs. Gemma Integration with Whisper: A Comparative Study in Multilingual SpeechLLM Systems

Idiosyncrasies in Large Language Models

Experiential Semantic Information and Brain Alignment: Are Multimodal Models Better than Language Models?

A Structured Bangla Dataset of Disease-Symptom Associations to Improve Diagnostic Accuracy

An Empirical Study of LLM-as-a-Judge: How Design Choices Impact Evaluation Reliability

EvolvTrip: Enhancing Literary Character Understanding with Temporal Theory-of-Mind Graphs

最近の投稿

最近のコメント

アーカイブ

カテゴリー