月別アーカイブ: 2025年1月

Scaling Efficient LLMs

要約 トレーニングされた LLM は通常、ほとんどのパラメーターがゼロであるため … 続きを読む

カテゴリー: cs.CL, cs.LG | Scaling Efficient LLMs はコメントを受け付けていません

Piano Transcription by Hierarchical Language Modeling with Pretrained Roll-based Encoders

要約 生のオーディオから音符を取得することを目的とした自動音楽転写 (AMT) … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.SD, eess.AS | Piano Transcription by Hierarchical Language Modeling with Pretrained Roll-based Encoders はコメントを受け付けていません

Lived Experience Not Found: LLMs Struggle to Align with Experts on Addressing Adverse Drug Reactions from Psychiatric Medication Use

要約 精神科治療薬による薬物副作用(ADR)は、メンタルヘルス患者の入院の主な原 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CY | Lived Experience Not Found: LLMs Struggle to Align with Experts on Addressing Adverse Drug Reactions from Psychiatric Medication Use はコメントを受け付けていません

Samba-ASR: State-Of-The-Art Speech Recognition Leveraging Structured State-Space Models

要約 私たちは、状態空間モデル (SSM) の基礎に基づいて構築された、新しい … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | Samba-ASR: State-Of-The-Art Speech Recognition Leveraging Structured State-Space Models はコメントを受け付けていません

PRMBench: A Fine-grained and Challenging Benchmark for Process-Level Reward Models

要約 プロセス レベルの報酬モデル (PRM) は、複雑な推論および意思決定タス … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | PRMBench: A Fine-grained and Challenging Benchmark for Process-Level Reward Models はコメントを受け付けていません

VideoAnydoor: High-fidelity Video Object Insertion with Precise Motion Control

要約 ビデオ生成は大幅に進歩しましたが、特定のオブジェクトをビデオに挿入すること … 続きを読む

カテゴリー: cs.CV | VideoAnydoor: High-fidelity Video Object Insertion with Precise Motion Control はコメントを受け付けていません

CONTINUUM: Detecting APT Attacks through Spatial-Temporal Graph Neural Networks

要約 Advanced Persistent Threat (APT) は、その … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.NI | CONTINUUM: Detecting APT Attacks through Spatial-Temporal Graph Neural Networks はコメントを受け付けていません

LightGNN: Simple Graph Neural Network for Recommendation

要約 グラフ ニューラル ネットワーク (GNN) は、高次表現のスムージングを … 続きを読む

カテゴリー: cs.AI, cs.IR, cs.LG | LightGNN: Simple Graph Neural Network for Recommendation はコメントを受け付けていません

SceneVTG++: Controllable Multilingual Visual Text Generation in the Wild

要約 自然風景の画像内にビジュアル テキストを生成することは、多くの未解決の問題 … 続きを読む

カテゴリー: cs.CV | SceneVTG++: Controllable Multilingual Visual Text Generation in the Wild はコメントを受け付けていません

Socratic Questioning: Learn to Self-guide Multimodal Reasoning in the Wild

要約 複雑な視覚的推論は、今日でも重要な課題です。 通常、この課題には、思考連鎖 … 続きを読む

カテゴリー: cs.AI, cs.CV | Socratic Questioning: Learn to Self-guide Multimodal Reasoning in the Wild はコメントを受け付けていません