月別アーカイブ: 2024年9月

Squid: Long Context as a New Modality for Energy-Efficient On-Device Language Models

要約 本論文では、言語モデルにおける長いコンテキストのエネルギー効率的な処理のた … 続きを読む

カテゴリー: cs.CL | Squid: Long Context as a New Modality for Energy-Efficient On-Device Language Models はコメントを受け付けていません

A Fundamental Trade-off in Aligned Language Models and its Relation to Sampling Adaptors

要約 人間が読み手として判断した文字列の品質と、言語モデルのもとでの確率$p(˶ … 続きを読む

カテゴリー: cs.CL | A Fundamental Trade-off in Aligned Language Models and its Relation to Sampling Adaptors はコメントを受け付けていません

Improving Rare Word Translation With Dictionaries and Attention Masking

要約 機械翻訳では、希少語は、特に低リソースやドメイン外の翻訳環境において、主流 … 続きを読む

カテゴリー: cs.CL, cs.LG | Improving Rare Word Translation With Dictionaries and Attention Masking はコメントを受け付けていません

Mamba3D: Enhancing Local Features for 3D Point Cloud Analysis via State Space Model

要約 点群解析のための既存のTransformerベースのモデルは、2次関数的な … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Mamba3D: Enhancing Local Features for 3D Point Cloud Analysis via State Space Model はコメントを受け付けていません

An Effective Information Theoretic Framework for Channel Pruning

要約 チャンネル刈り込みは、畳み込みニューラルネットワークを高速化・圧縮するため … 続きを読む

カテゴリー: cs.AI, cs.IT, cs.LG, math.IT | An Effective Information Theoretic Framework for Channel Pruning はコメントを受け付けていません

Stabilizing Extreme Q-learning by Maclaurin Expansion

要約 オフライン強化学習では、データセットから分布外の行動を評価することによる性 … 続きを読む

カテゴリー: cs.AI, cs.LG | Stabilizing Extreme Q-learning by Maclaurin Expansion はコメントを受け付けていません

The Cultivated Practices of Text-to-Image Generation

要約 人類は、生成人工知能(AI)を使って誰でもデジタル情報を合成できる、斬新な … 続きを読む

カテゴリー: cs.AI, cs.CY, I.2.0 | The Cultivated Practices of Text-to-Image Generation はコメントを受け付けていません

Sentiment Analysis Across Languages: Evaluation Before and After Machine Translation to English

要約 人々は世界中で7,000以上の言語でコミュニケーションしており、インドだけ … 続きを読む

カテゴリー: cs.AI, cs.CL | Sentiment Analysis Across Languages: Evaluation Before and After Machine Translation to English はコメントを受け付けていません

Domain-Specific Improvement on Psychotherapy Chatbot Using Assistant

要約 大規模言語モデル(LLM)は、人間が書いた指示データを用いた特定のタスクに … 続きを読む

カテゴリー: cs.AI, cs.CL | Domain-Specific Improvement on Psychotherapy Chatbot Using Assistant はコメントを受け付けていません

An Investigation of Neuron Activation as a Unified Lens to Explain Chain-of-Thought Eliciting Arithmetic Reasoning of LLMs

要約 大規模言語モデル(LLM)は、Chain-of-Thought(CoT)プ … 続きを読む

カテゴリー: cs.AI, I.2.7 | An Investigation of Neuron Activation as a Unified Lens to Explain Chain-of-Thought Eliciting Arithmetic Reasoning of LLMs はコメントを受け付けていません