月別アーカイブ: 2025年1月

Scaling Efficient LLMs

投稿日: 2025年1月8日作成者: jarxiv

要約トレーニングされた LLM は通常、ほとんどのパラメーターがゼロであるため … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Piano Transcription by Hierarchical Language Modeling with Pretrained Roll-based Encoders

投稿日: 2025年1月8日作成者: jarxiv

要約生のオーディオから音符を取得することを目的とした自動音楽転写 (AMT) … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Lived Experience Not Found: LLMs Struggle to Align with Experts on Addressing Adverse Drug Reactions from Psychiatric Medication Use

投稿日: 2025年1月8日作成者: jarxiv

要約精神科治療薬による薬物副作用（ADR）は、メンタルヘルス患者の入院の主な原 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CY | コメントを受け付けていません

Samba-ASR: State-Of-The-Art Speech Recognition Leveraging Structured State-Space Models

投稿日: 2025年1月8日作成者: jarxiv

要約私たちは、状態空間モデル (SSM) の基礎に基づいて構築された、新しい … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | コメントを受け付けていません

PRMBench: A Fine-grained and Challenging Benchmark for Process-Level Reward Models

投稿日: 2025年1月8日作成者: jarxiv

要約プロセスレベルの報酬モデル (PRM) は、複雑な推論および意思決定タス … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

VideoAnydoor: High-fidelity Video Object Insertion with Precise Motion Control

投稿日: 2025年1月8日作成者: jarxiv

要約ビデオ生成は大幅に進歩しましたが、特定のオブジェクトをビデオに挿入すること … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

CONTINUUM: Detecting APT Attacks through Spatial-Temporal Graph Neural Networks

投稿日: 2025年1月8日作成者: jarxiv

要約 Advanced Persistent Threat (APT) は、その … 続きを読む →

カテゴリー: cs.AI, cs.CR, cs.NI | コメントを受け付けていません

LightGNN: Simple Graph Neural Network for Recommendation

投稿日: 2025年1月8日作成者: jarxiv

要約グラフニューラルネットワーク (GNN) は、高次表現のスムージングを … 続きを読む →

カテゴリー: cs.AI, cs.IR, cs.LG | コメントを受け付けていません

SceneVTG++: Controllable Multilingual Visual Text Generation in the Wild

投稿日: 2025年1月8日作成者: jarxiv

要約自然風景の画像内にビジュアルテキストを生成することは、多くの未解決の問題 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Socratic Questioning: Learn to Self-guide Multimodal Reasoning in the Wild

投稿日: 2025年1月8日作成者: jarxiv

要約複雑な視覚的推論は、今日でも重要な課題です。通常、この課題には、思考連鎖 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

月別アーカイブ: 2025年1月

Scaling Efficient LLMs

Piano Transcription by Hierarchical Language Modeling with Pretrained Roll-based Encoders

Lived Experience Not Found: LLMs Struggle to Align with Experts on Addressing Adverse Drug Reactions from Psychiatric Medication Use

Samba-ASR: State-Of-The-Art Speech Recognition Leveraging Structured State-Space Models

PRMBench: A Fine-grained and Challenging Benchmark for Process-Level Reward Models

VideoAnydoor: High-fidelity Video Object Insertion with Precise Motion Control

CONTINUUM: Detecting APT Attacks through Spatial-Temporal Graph Neural Networks

LightGNN: Simple Graph Neural Network for Recommendation

SceneVTG++: Controllable Multilingual Visual Text Generation in the Wild

Socratic Questioning: Learn to Self-guide Multimodal Reasoning in the Wild

最近の投稿

最近のコメント

アーカイブ

カテゴリー