月別アーカイブ: 2024年4月

Modeling Selective Feature Attention for Representation-based Siamese Text Matching

要約 表現ベースのシャム ネットワークは、導入コストと推論コストが低いため、軽量 … 続きを読む

カテゴリー: cs.CL | Modeling Selective Feature Attention for Representation-based Siamese Text Matching はコメントを受け付けていません

Continual Learning of Large Language Models: A Comprehensive Survey

要約 事前に収集された静的な一般的なデータセットでトレーニングされた大規模言語モ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Continual Learning of Large Language Models: A Comprehensive Survey はコメントを受け付けていません

Weak-to-Strong Extrapolation Expedites Alignment

要約 大規模言語モデル (LLM) の機能は、理想的にはデータとコンピューティン … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Weak-to-Strong Extrapolation Expedites Alignment はコメントを受け付けていません

Improving Diversity of Commonsense Generation by Large Language Models via In-Context Learning

要約 生成常識推論 (GCR) では、一貫した文章を生成しながら、常識知識を使用 … 続きを読む

カテゴリー: cs.CL | Improving Diversity of Commonsense Generation by Large Language Models via In-Context Learning はコメントを受け付けていません

Make Your LLM Fully Utilize the Context

要約 現代の大規模言語モデル (LLM) の多くは長い入力を処理できますが、中間 … 続きを読む

カテゴリー: cs.AI, cs.CL | Make Your LLM Fully Utilize the Context はコメントを受け付けていません

IndicGenBench: A Multilingual Benchmark to Evaluate Generation Capabilities of LLMs on Indic Languages

要約 大規模言語モデル (LLM) の採用が世界中で増加しているため、LLM が … 続きを読む

カテゴリー: cs.CL | IndicGenBench: A Multilingual Benchmark to Evaluate Generation Capabilities of LLMs on Indic Languages はコメントを受け付けていません

Make-it-Real: Unleashing Large Multimodal Model’s Ability for Painting 3D Objects with Realistic Materials

要約 物理的にリアルなマテリアルは、さまざまなアプリケーションや照明条件にわたっ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Make-it-Real: Unleashing Large Multimodal Model’s Ability for Painting 3D Objects with Realistic Materials はコメントを受け付けていません

Using Deep Learning to Identify Initial Error Sensitivity of ENSO Forecasts

要約 ディープラーニングとモデルアナログ予測を統合するハイブリッド手法を導入しま … 続きを読む

カテゴリー: cs.LG, physics.ao-ph | Using Deep Learning to Identify Initial Error Sensitivity of ENSO Forecasts はコメントを受け付けていません

NeuraChip: Accelerating GNN Computations with a Hash-based Decoupled Spatial Accelerator

要約 グラフ ニューラル ネットワーク (GNN) は、ソーシャル ネットワーク … 続きを読む

カテゴリー: cs.AR, cs.DC, cs.LG, cs.NE | NeuraChip: Accelerating GNN Computations with a Hash-based Decoupled Spatial Accelerator はコメントを受け付けていません

The WMDP Benchmark: Measuring and Reducing Malicious Use With Unlearning

要約 人工知能に関するホワイトハウス大統領令は、生物兵器、サイバー兵器、化学兵器 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CY, cs.LG | The WMDP Benchmark: Measuring and Reducing Malicious Use With Unlearning はコメントを受け付けていません