月別アーカイブ: 2024年9月

Generate-then-Ground in Retrieval-Augmented Generation for Multi-hop Question Answering

要約 マルチホップ質問応答 (MHQA) タスクは、集中的な知識が必要なため、大 … 続きを読む

カテゴリー: cs.CL, cs.IR | Generate-then-Ground in Retrieval-Augmented Generation for Multi-hop Question Answering はコメントを受け付けていません

Schrodinger’s Memory: Large Language Models

要約 メモリは LLM の機能の基礎ですが、過去の研究では、LLM のメモリ機能 … 続きを読む

カテゴリー: cs.CL | Schrodinger’s Memory: Large Language Models はコメントを受け付けていません

Incorporating Classifier-Free Guidance in Diffusion Model-Based Recommendation

要約 この論文では、分類子を使用しないガイダンスを組み込んだ拡散ベースの推奨シス … 続きを読む

カテゴリー: cs.CL, cs.IR | Incorporating Classifier-Free Guidance in Diffusion Model-Based Recommendation はコメントを受け付けていません

Security Attacks on LLM-based Code Completion Tools

要約 大規模言語モデル (LLM) の急速な開発により、コード補完機能が大幅に進 … 続きを読む

カテゴリー: cs.CL, cs.CR | Security Attacks on LLM-based Code Completion Tools はコメントを受け付けていません

Causal Language Modeling Can Elicit Search and Reasoning Capabilities on Logic Puzzles

要約 Transformer アーキテクチャを使用した因果言語モデリングは、ここ … 続きを読む

カテゴリー: cs.CL, cs.LG | Causal Language Modeling Can Elicit Search and Reasoning Capabilities on Logic Puzzles はコメントを受け付けていません

Assessing biomedical knowledge robustness in large language models by query-efficient sampling attacks

要約 大規模言語モデル (LLM) におけるパラメトリック ドメインの知識がます … 続きを読む

カテゴリー: cs.CL, cs.CR, stat.AP | Assessing biomedical knowledge robustness in large language models by query-efficient sampling attacks はコメントを受け付けていません

DILA: Dictionary Label Attention for Mechanistic Interpretability in High-dimensional Multi-label Medical Coding Prediction

要約 医療コーディングなど、高次元または極端なマルチラベルを予測するには、精度と … 続きを読む

カテゴリー: cs.CL | DILA: Dictionary Label Attention for Mechanistic Interpretability in High-dimensional Multi-label Medical Coding Prediction はコメントを受け付けていません

Linguistic Bias in ChatGPT: Language Models Reinforce Dialect Discrimination

要約 我々は、英語の 10 の方言 (標準アメリカ英語、標準イギリス英語、および … 続きを読む

カテゴリー: cs.CL, cs.CY | Linguistic Bias in ChatGPT: Language Models Reinforce Dialect Discrimination はコメントを受け付けていません

RetrievalAttention: Accelerating Long-Context LLM Inference via Vector Retrieval

要約 トランスフォーマーベースの大規模言語モデル (LLM) は、さまざまなドメ … 続きを読む

カテゴリー: cs.CL, cs.LG | RetrievalAttention: Accelerating Long-Context LLM Inference via Vector Retrieval はコメントを受け付けていません

Relative Positioning for Aerial Robot Path Planning in GPS Denied Environment

要約 オーストラリアでは無人航空機 (UAV) とも呼ばれるインテリジェント航空 … 続きを読む

カテゴリー: cs.AI, cs.RO | Relative Positioning for Aerial Robot Path Planning in GPS Denied Environment はコメントを受け付けていません