A Cautionary Tale About ‘Neutrally’ Informative AI Tools Ahead of the 2025 Federal Elections in Germany

要約

この研究では、客観的な政治情報を提供する際に、AIベースの投票アドバイスアプリケーション(VAAS)および大規模な言語モデル(LLM)の信頼性を調べます。
私たちの分析は、WAHL-O-MATの38の声明に対する党の回答との比較に基づいています。Wahl-O-Matは、彼らの意見を政党の立場と比較することで有権者に通知するのに役立つ、確立されたドイツのオンラインツールです。
LLMSについては、重要なバイアスを特定します。
彼らは、左翼のパーティーと強い整列(平均で75%以上)を示し、中心右(50%が小さい)および右翼のパーティー(約30%)との大幅に低い整合性を示します。
さらに、有権者に客観的に通知することを目的としたVAAの場合、WAHL-O-MATの当事者の記載されているポジションからの実質的な逸脱を発見しました。

後者については、単純な迅速な注入が、政党と右翼の過激派の関係の間の存在しないつながりなどの誤った主張を含む、深刻な幻覚をもたらしたことさえ観察しました。

要約(オリジナル)

In this study, we examine the reliability of AI-based Voting Advice Applications (VAAs) and large language models (LLMs) in providing objective political information. Our analysis is based upon a comparison with party responses to 38 statements of the Wahl-O-Mat, a well-established German online tool that helps inform voters by comparing their views with political party positions. For the LLMs, we identify significant biases. They exhibit a strong alignment (over 75% on average) with left-wing parties and a substantially lower alignment with center-right (smaller 50%) and right-wing parties (around 30%). Furthermore, for the VAAs, intended to objectively inform voters, we found substantial deviations from the parties’ stated positions in Wahl-O-Mat: While one VAA deviated in 25% of cases, another VAA showed deviations in more than 50% of cases. For the latter, we even observed that simple prompt injections led to severe hallucinations, including false claims such as non-existent connections between political parties and right-wing extremist ties.

arxiv情報

著者 Ina Dormuth,Sven Franke,Marlies Hafer,Tim Katzke,Alexander Marx,Emmanuel Müller,Daniel Neider,Markus Pauly,Jérôme Rutinowski
発行日 2025-02-21 16:30:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG | A Cautionary Tale About ‘Neutrally’ Informative AI Tools Ahead of the 2025 Federal Elections in Germany はコメントを受け付けていません

MetaDE: Evolving Differential Evolution by Differential Evolution

要約

進化的計算(EC)ドメインの基礎として、差別的な進化(DE)は、挑戦的なブラックボックスの最適化の問題を処理する際のシンプルさと有効性で知られています。
DEの利点は十分に認識されていますが、ピーク性能を達成することは、突然変異因子、クロスオーバー確率、特定のDE戦略の選択などのハイパーパラメーターに大きく依存します。
このハイパーパラメーターのジレンマに対する従来のアプローチは、パラメーターの調整または適応メカニズムに傾いています。
ただし、特定の問題に合わせた最適な設定を特定することは、持続的な課題のままです。
これに応じて、メタレベルでDE自体を使用してDEの固有のハイパーパラメーターと戦略を進化させるアプローチであるMetadeを紹介します。
Metadeの極めて重要な側面は、特殊なパラメーター化手法であり、進化プロセス全体でDEのパラメーターと戦略を動的に変更する機能を備えています。
計算効率を高めるために、Metadeには、GPUアクセラル化コンピューティングフレームワークを介して並列処理を活用する設計が組み込まれています。
このようなフレームワーク内では、DEは単なるソルバーではなく、独自の構成のオプティマイザーでもあるため、ハイパーパラメーターの最適化と問題解決のプロセスがまとまりのある自動化されたワークフローに合理化されます。
CEC2022ベンチマークスイートの広範な評価は、Metadeの有望なパフォーマンスを示しています。
さらに、進化補強学習を介してロボット制御に適用されると、Metadeは有望なパフォーマンスも示しています。
Source Code of Metadeは、https://github.com/emigroup/metadeで公開されています。

要約(オリジナル)

As a cornerstone in the Evolutionary Computation (EC) domain, Differential Evolution (DE) is known for its simplicity and effectiveness in handling challenging black-box optimization problems. While the advantages of DE are well-recognized, achieving peak performance heavily depends on its hyperparameters such as the mutation factor, crossover probability, and the selection of specific DE strategies. Traditional approaches to this hyperparameter dilemma have leaned towards parameter tuning or adaptive mechanisms. However, identifying the optimal settings tailored for specific problems remains a persistent challenge. In response, we introduce MetaDE, an approach that evolves DE’s intrinsic hyperparameters and strategies using DE itself at a meta-level. A pivotal aspect of MetaDE is a specialized parameterization technique, which endows it with the capability to dynamically modify DE’s parameters and strategies throughout the evolutionary process. To augment computational efficiency, MetaDE incorporates a design that leverages parallel processing through a GPU-accelerated computing framework. Within such a framework, DE is not just a solver but also an optimizer for its own configurations, thus streamlining the process of hyperparameter optimization and problem-solving into a cohesive and automated workflow. Extensive evaluations on the CEC2022 benchmark suite demonstrate MetaDE’s promising performance. Moreover, when applied to robot control via evolutionary reinforcement learning, MetaDE also demonstrates promising performance. The source code of MetaDE is publicly accessible at: https://github.com/EMI-Group/metade.

arxiv情報

著者 Minyang Chen,Chenchen Feng,and Ran Cheng
発行日 2025-02-21 16:31:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.NE | MetaDE: Evolving Differential Evolution by Differential Evolution はコメントを受け付けていません

Feature maps for the Laplacian kernel and its generalizations

要約

機械学習におけるカーネル法の最近のアプリケーションでは、ガウスカーネルと比較した帯域幅のハイパーパラメーターの安定性と、その表現力が深い深さの神経接線カーネルの表現と同等であるため、ラプラシアンカーネルに新たな関心が見られました。
接続されたネットワーク。
ただし、ガウスカーネルとは異なり、ラプラシアンカーネルは分離できません。
これは、特にランダムフーリエ機能(RFF)方法論とそのバリアントを介して、それを近似するための課題をもたらします。
この作業では、Laplacianカーネルとその2つの一般化のランダムな機能を提供します:mat \ ‘{e} rnカーネルと指数パワーカーネル。
ランダムな特徴がこれらのカーネルを近似するように、重量行列をサンプリングするための効率的に実装可能なスキームを提供します。
これらの重量マトリックスは、弱く結合した重尾のランダム性を持っています。
実際のデータセットでの数値実験を介して、これらのランダム機能マップの有効性を示します。

要約(オリジナル)

Recent applications of kernel methods in machine learning have seen a renewed interest in the Laplacian kernel, due to its stability to the bandwidth hyperparameter in comparison to the Gaussian kernel, as well as its expressivity being equivalent to that of the neural tangent kernel of deep fully connected networks. However, unlike the Gaussian kernel, the Laplacian kernel is not separable. This poses challenges for techniques to approximate it, especially via the random Fourier features (RFF) methodology and its variants. In this work, we provide random features for the Laplacian kernel and its two generalizations: Mat\'{e}rn kernel and the Exponential power kernel. We provide efficiently implementable schemes to sample weight matrices so that random features approximate these kernels. These weight matrices have a weakly coupled heavy-tailed randomness. Via numerical experiments on real datasets we demonstrate the efficacy of these random feature maps.

arxiv情報

著者 Sudhendu Ahir,Parthe Pandit
発行日 2025-02-21 16:36:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, stat.ML | Feature maps for the Laplacian kernel and its generalizations はコメントを受け付けていません

Conditional [MASK] Discrete Diffusion Language Model

要約

自動回帰モデルは自然言語処理に優れていますが、多くの場合、多様なテキストを生成するのに苦労し、制御可能性が限られています。
非自動再帰的方法は代替手段である可能性がありますが、しばしば縮退した出力を生成し、条件付き生成で欠点を示します。
これらの課題に対処するために、条件付きマルコフランダムフィールドの理論的レンズを介して条件付きマスク言語モデルを拡散言語モデルに統合する新しいフレームワークであるDiffusion-eagsを提案します。
そうすることで、各モデルの欠点を相殺するために、エントロピーに適したギブスサンプリングとエントロピーベースのノイズスケジューリングを提案します。
実験結果は、拡散EAGがベースラインよりも優れていることを示しており、最高品質の多様性のトレードオフを達成し、非自動性テキスト生成におけるその有効性を示しています。

要約(オリジナル)

Although auto-regressive models excel in natural language processing, they often struggle to generate diverse text and provide limited controllability. Non-auto-regressive methods could be an alternative but often produce degenerate outputs and exhibit shortcomings in conditional generation. To address these challenges, we propose Diffusion-EAGS, a novel framework that integrates conditional masked language models into diffusion language models through the theoretical lens of a conditional Markov Random Field. In doing so, we propose entropy-adaptive Gibbs sampling and entropy-based noise scheduling to counterbalance each model’s shortcomings. Experimental results show that Diffusion-EAGS outperforms baselines and achieves the best quality-diversity tradeoff, demonstrating its effectiveness in non-autoregressive text generation.

arxiv情報

著者 Hyukhun Koh,Minha Jhang,Dohyung Kim,Sangmook Lee,Kyomin Jung
発行日 2025-02-21 16:44:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL | Conditional [MASK] Discrete Diffusion Language Model はコメントを受け付けていません

Model Lakes

要約

一連の深い学習モデルを考えると、タスクに適したモデルを見つけること、モデルを理解し、モデルが互いにどのように異なるかを特徴付けるのは難しい場合があります。
現在、開業医は手動で書かれたドキュメントに依存して、モデルを理解して選択しています。
ただし、すべてのモデルに完全で信頼できるドキュメントがあるわけではありません。
モデルの数が増えるにつれて、モデルを見つけ、区別し、理解することの課題がますます重要になります。
データ湖の研究からインスピレーションを得て、モデル湖の概念を紹介します。
モデルの帰属、バージョン化、検索、ベンチマークなどの主要なモデル湖のタスクを正式にし、大規模なモデルの管理における基本的な研究の課題について議論します。
また、大規模なモデル管理の研究に耐えるためにもたらされるデータ管理手法を探求します。

要約(オリジナル)

Given a set of deep learning models, it can be hard to find models appropriate to a task, understand the models, and characterize how models are different one from another. Currently, practitioners rely on manually-written documentation to understand and choose models. However, not all models have complete and reliable documentation. As the number of models increases, the challenges of finding, differentiating, and understanding models become increasingly crucial. Inspired from research on data lakes, we introduce the concept of model lakes. We formalize key model lake tasks, including model attribution, versioning, search, and benchmarking, and discuss fundamental research challenges in the management of large models. We also explore what data management techniques can be brought to bear on the study of large model management.

arxiv情報

著者 Koyena Pal,David Bau,Renée J. Miller
発行日 2025-02-21 16:46:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.DB | Model Lakes はコメントを受け付けていません

Reasoning based on symbolic and parametric knowledge bases: a survey

要約

推論は人間の知性の基本であり、問​​題解決、意思決定、批判的思考にとって重要です。
推論とは、臨床診断、基礎教育、財務分析などのさまざまなアプリケーションをサポートできる既存の知識に基づいて新しい結論を導き出すことを指します。
推論関連の方法をレビューするために多くの調査が提案されていますが、それらのどれも、依存知識ベースの観点からこれらの方法を体系的に調査していません。
知識ベースが適用されるシナリオとそのストレージ形式の両方が大きく異なります。
したがって、知識ベースの観点から推論方法を調査することは、課題と将来の方向をよりよく理解するのに役立ちます。
このギャップを埋めるために、この論文は最初に知識ベースを象徴的でパラメトリックなものに分類します。
前者は、情報を人間の読み取り可能な記号に明示的に保存し、後者はパラメーター内で知識を暗黙的にエンコードします。
次に、象徴的な知識ベース、パラメトリック知識ベース、および両方を使用して、推論方法の包括的な概要を提供します。
最後に、人間と機械の知能のギャップを埋めるための推論能力を高めるための将来の方向を特定します。

要約(オリジナル)

Reasoning is fundamental to human intelligence, and critical for problem-solving, decision-making, and critical thinking. Reasoning refers to drawing new conclusions based on existing knowledge, which can support various applications like clinical diagnosis, basic education, and financial analysis. Though a good number of surveys have been proposed for reviewing reasoning-related methods, none of them has systematically investigated these methods from the viewpoint of their dependent knowledge base. Both the scenarios to which the knowledge bases are applied and their storage formats are significantly different. Hence, investigating reasoning methods from the knowledge base perspective helps us better understand the challenges and future directions. To fill this gap, this paper first classifies the knowledge base into symbolic and parametric ones. The former explicitly stores information in human-readable symbols, and the latter implicitly encodes knowledge within parameters. Then, we provide a comprehensive overview of reasoning methods using symbolic knowledge bases, parametric knowledge bases, and both of them. Finally, we identify the future direction toward enhancing reasoning capabilities to bridge the gap between human and machine intelligence.

arxiv情報

著者 Mayi Xu,Yunfeng Ning,Yongqi Li,Jianhao Chen,Jintao Wen,Yao Xiao,Shen Zhou,Birong Pan,Zepeng Bao,Xin Miao,Hankun Kang,Ke Sun,Tieyun Qian
発行日 2025-02-21 16:53:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL | Reasoning based on symbolic and parametric knowledge bases: a survey はコメントを受け付けていません

Improving the Scaling Laws of Synthetic Data with Deliberate Practice

要約

人間の学習における意図的な実践の原則に触発されて、私たちは、動的な合成データ生成を通じてサンプル効率を改善する新しいフレームワークである合成データ生成(DP)の意図的な実践を提案します。
以前の作業では、合成データのスケーリングが本質的に困難であることが示されています。新しいデータを素朴に追加すると、リターンが減少することが示されています。
これに対処するために、剪定はスケーリングを改善し、モデルが最も有益な合成サンプルに焦点を合わせるための重要なメカニズムとして特定されています。
大規模なデータセットを生成してその後剪定するのではなく、DPは有益なサンプルの直接生成を効率的に近似します。
理論的には、挑戦的で有益な例に関するトレーニングがスケーリング法則を改善し、DPがトレーニングサンプルと反復を大幅に少なくしてより良いスケーリングパフォーマンスを達成することを経験的に検証する方法を示します。
ImagENET-100では、DPはサンプルが3.4倍少なくなり、繰り返しが6倍少なくなりますが、Imagenet-1Kでは8倍少ないサンプルが生成されます。

要約(オリジナル)

Inspired by the principle of deliberate practice in human learning, we propose Deliberate Practice for Synthetic Data Generation (DP), a novel framework that improves sample efficiency through dynamic synthetic data generation. Prior work has shown that scaling synthetic data is inherently challenging, as naively adding new data leads to diminishing returns. To address this, pruning has been identified as a key mechanism for improving scaling, enabling models to focus on the most informative synthetic samples. Rather than generating a large dataset and pruning it afterward, DP efficiently approximates the direct generation of informative samples. We theoretically show how training on challenging, informative examples improves scaling laws and empirically validate that DP achieves better scaling performance with significantly fewer training samples and iterations. On ImageNet-100, DP generates 3.4x fewer samples and requires six times fewer iterations, while on ImageNet-1k, it generates 8x fewer samples with a 30 percent reduction in iterations, all while achieving superior performance compared to prior work.

arxiv情報

著者 Reyhane Askari-Hemmat,Mohammad Pezeshki,Elvis Dohmatob,Florian Bordes,Pietro Astolfi,Melissa Hall,Jakob Verbeek,Michal Drozdzal,Adriana Romero-Soriano
発行日 2025-02-21 16:56:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG | Improving the Scaling Laws of Synthetic Data with Deliberate Practice はコメントを受け付けていません

LightThinker: Thinking Step-by-Step Compression

要約

大規模な言語モデル(LLM)は、複雑な推論タスクで顕著なパフォーマンスを示していますが、その効率は、長いトークンの生成に関連する実質的なメモリと計算コストによって妨げられています。
この論文では、LLMSが推論中にLLMSが中間思考を動的に圧縮できるようにする新しい方法であるLightThinkerを提案します。
人間の認知プロセスに触発されて、Light -Thinkerは冗長思想ステップをコンパクトな表現に圧縮し、元の推論チェーンを破棄し、それによりコンテキストウィンドウに保存されているトークンの数を大幅に減らします。
これは、データ構築を介して圧縮を実行する時期と方法でモデルをトレーニングし、隠された状態を凝縮した要点トークンにマッピングし、特殊な注意マスクを作成することで実現されます。
さらに、依存関係(DEP)メトリックを導入して、生成中の履歴トークンへの依存を測定することにより、圧縮の程度を定量化します。
4つのデータセットと2つのモデルでの広範な実験では、競争の精度を維持しながら、ライトチャンカーがピークメモリの使用と推論時間を短縮することが示されています。
私たちの仕事は、パフォーマンスを犠牲にすることなく、複雑な推論タスクでLLMの効率を改善するための新しい方向性を提供します。
コードはhttps://github.com/zjunlp/lightthinkerでリリースされます。

要約(オリジナル)

Large language models (LLMs) have shown remarkable performance in complex reasoning tasks, but their efficiency is hindered by the substantial memory and computational costs associated with generating lengthy tokens. In this paper, we propose LightThinker, a novel method that enables LLMs to dynamically compress intermediate thoughts during reasoning. Inspired by human cognitive processes, LightThinker compresses verbose thought steps into compact representations and discards the original reasoning chains, thereby significantly reducing the number of tokens stored in the context window. This is achieved by training the model on when and how to perform compression through data construction, mapping hidden states to condensed gist tokens, and creating specialized attention masks. Additionally, we introduce the Dependency (Dep) metric to quantify the degree of compression by measuring the reliance on historical tokens during generation. Extensive experiments on four datasets and two models show that LightThinker reduces peak memory usage and inference time, while maintaining competitive accuracy. Our work provides a new direction for improving the efficiency of LLMs in complex reasoning tasks without sacrificing performance. Code will be released at https://github.com/zjunlp/LightThinker.

arxiv情報

著者 Jintian Zhang,Yuqi Zhu,Mengshu Sun,Yujie Luo,Shuofei Qiao,Lun Du,Da Zheng,Huajun Chen,Ningyu Zhang
発行日 2025-02-21 16:57:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.IR, cs.LG, cs.MM | LightThinker: Thinking Step-by-Step Compression はコメントを受け付けていません

Generalizing From Short to Long: Effective Data Synthesis for Long-Context Instruction Tuning

要約

大規模な言語モデル(LLMS)のロングコンテキストモデリングは、多くの現実世界ユースケースがドキュメントなどのより長い入力よりも推論を必要とするため、最近の研究の重要な分野です。
長いコンテキストのモデリングに関する研究の焦点は、位置をモデル化する方法に関するものであり、指導チューニングなどの言語モデリングの他の重要な側面についてはほとんど調査されていません。
長いコンテキストトレーニングの例は、作成と使用に挑戦的で高価です。
この論文では、長いコンテキスト事前訓練モデルのトレーニング後の段階の命令データを設計する方法を調査します。トレーニング後の最適で効率的なトレーニングに必要なコンテキストの量とタイプのタイプ。
私たちの制御された研究は、短いコンテキストで命令調整されたモデルがより長いコンテキストに効果的に一般化すると同時に、命令の難易度やコンテキスト構成などの他の重要な要因を特定できることを明らかにしています。
これらの調査結果に基づいて、既製のLLMSを活用して高品質の命令回答ペアの拡張された背景コンテキストを生成する新しいデータ合成フレームワークであるコンテキスト合成を提案します。
ドキュメントレベルのベンチマーク(Longbench)の実験結果は、提案されたアプローチが以前の命令合成アプローチよりも優れており、人間が解決した長いコンテキスト命令データのパフォーマンスに近づくことを示しています。
このプロジェクトは、https://github.com/njunlp/context-synthesisで入手できます。

要約(オリジナル)

Long-context modelling for large language models (LLMs) has been a key area of recent research because many real world use cases require reasoning over longer inputs such as documents. The focus of research into modelling long context has been on how to model position and there has been little investigation into other important aspects of language modelling such as instruction tuning. Long context training examples are challenging and expensive to create and use. In this paper, we investigate how to design instruction data for the post-training phase of a long context pre-trained model: how much and what type of context is needed for optimal and efficient post-training. Our controlled study reveals that models instruction-tuned on short contexts can effectively generalize to longer ones, while also identifying other critical factors such as instruction difficulty and context composition. Based on these findings, we propose context synthesis, a novel data synthesis framework that leverages off-the-shelf LLMs to generate extended background contexts for high-quality instruction-answer pairs. Experiment results on the document-level benchmark (LongBench) demonstrate that our proposed approach outperforms previous instruction synthesis approaches and comes close to the performance of human-annotated long-context instruction data. The project will be available at: https://github.com/NJUNLP/context-synthesis.

arxiv情報

著者 Wenhao Zhu,Pinzhen Chen,Hanxu Hu,Shujian Huang,Fei Yuan,Jiajun Chen,Alexandra Birch
発行日 2025-02-21 17:02:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL | Generalizing From Short to Long: Effective Data Synthesis for Long-Context Instruction Tuning はコメントを受け付けていません

KAD: No More FAD! An Effective and Efficient Evaluation Metric for Audio Generation

要約

生成されたオーディオ信号の評価に広く採用されていますが、FR \ ‘Echetオーディオ距離(FAD)は、ガウスの仮定への依存、サンプルサイズへの感度、高い計算の複雑さなど、大きな制限に苦しんでいます。
別の方法として、最大平均矛盾(MMD)に基づいて、斬新で分布のない、偏り、計算効率の高いメトリックであるカーネルオーディオ距離(KAD)を導入します。
分析と実証的検証を通じて、KADの利点を示します。(1)サンプルサイズが小さくなるより速い収束、限られたデータで信頼できる評価を可能にします。
(2)スケーラブルなGPU加速度を備えた計算コストの削減。
(3)人間の知覚的判断とのより強い整合。
高度な埋め込みと特徴的なカーネルを活用することにより、KADは実際のオーディオと生成されたオーディオの微妙な違いをキャプチャします。
KADK ToolkitでオープンソースをかけたKADは、生成オーディオモデルを評価するための効率的で信頼性が高く、知覚的に整合したベンチマークを提供します。

要約(オリジナル)

Although being widely adopted for evaluating generated audio signals, the Fr\’echet Audio Distance (FAD) suffers from significant limitations, including reliance on Gaussian assumptions, sensitivity to sample size, and high computational complexity. As an alternative, we introduce the Kernel Audio Distance (KAD), a novel, distribution-free, unbiased, and computationally efficient metric based on Maximum Mean Discrepancy (MMD). Through analysis and empirical validation, we demonstrate KAD’s advantages: (1) faster convergence with smaller sample sizes, enabling reliable evaluation with limited data; (2) lower computational cost, with scalable GPU acceleration; and (3) stronger alignment with human perceptual judgments. By leveraging advanced embeddings and characteristic kernels, KAD captures nuanced differences between real and generated audio. Open-sourced in the kadtk toolkit, KAD provides an efficient, reliable, and perceptually aligned benchmark for evaluating generative audio models.

arxiv情報

著者 Yoonjin Chung,Pilsun Eu,Junwon Lee,Keunwoo Choi,Juhan Nam,Ben Sangbae Chon
発行日 2025-02-21 17:19:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.SD, eess.AS | KAD: No More FAD! An Effective and Efficient Evaluation Metric for Audio Generation はコメントを受け付けていません