投稿者「jarxiv」のアーカイブ

LargeAD: Large-Scale Cross-Sensor Data Pretraining for Autonomous Driving

投稿日: 2025年1月8日作成者: jarxiv

要約ビジョン基盤モデル (VFM) の最近の進歩により、2D の視覚認識に革命 … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Multimodal Machine Learning Can Predict Videoconference Fluidity and Enjoyment

投稿日: 2025年1月8日作成者: jarxiv

要約ビデオ会議は現在、仕事上でも非公式でも頻繁に行われるコミュニケーション手段 … 続きを読む →

カテゴリー: cs.HC, cs.LG, eess.AS, eess.IV | コメントを受け付けていません

Scaling Efficient LLMs

投稿日: 2025年1月8日作成者: jarxiv

要約トレーニングされた LLM は通常、ほとんどのパラメーターがゼロであるため … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Piano Transcription by Hierarchical Language Modeling with Pretrained Roll-based Encoders

投稿日: 2025年1月8日作成者: jarxiv

要約生のオーディオから音符を取得することを目的とした自動音楽転写 (AMT) … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Lived Experience Not Found: LLMs Struggle to Align with Experts on Addressing Adverse Drug Reactions from Psychiatric Medication Use

投稿日: 2025年1月8日作成者: jarxiv

要約精神科治療薬による薬物副作用（ADR）は、メンタルヘルス患者の入院の主な原 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CY | コメントを受け付けていません

Samba-ASR: State-Of-The-Art Speech Recognition Leveraging Structured State-Space Models

投稿日: 2025年1月8日作成者: jarxiv

要約私たちは、状態空間モデル (SSM) の基礎に基づいて構築された、新しい … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | コメントを受け付けていません

PRMBench: A Fine-grained and Challenging Benchmark for Process-Level Reward Models

投稿日: 2025年1月8日作成者: jarxiv

要約プロセスレベルの報酬モデル (PRM) は、複雑な推論および意思決定タス … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

VideoAnydoor: High-fidelity Video Object Insertion with Precise Motion Control

投稿日: 2025年1月8日作成者: jarxiv

要約ビデオ生成は大幅に進歩しましたが、特定のオブジェクトをビデオに挿入すること … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

CONTINUUM: Detecting APT Attacks through Spatial-Temporal Graph Neural Networks

投稿日: 2025年1月8日作成者: jarxiv

要約 Advanced Persistent Threat (APT) は、その … 続きを読む →

カテゴリー: cs.AI, cs.CR, cs.NI | コメントを受け付けていません

LightGNN: Simple Graph Neural Network for Recommendation

投稿日: 2025年1月8日作成者: jarxiv

要約グラフニューラルネットワーク (GNN) は、高次表現のスムージングを … 続きを読む →

カテゴリー: cs.AI, cs.IR, cs.LG | コメントを受け付けていません

投稿者「jarxiv」のアーカイブ

LargeAD: Large-Scale Cross-Sensor Data Pretraining for Autonomous Driving

Multimodal Machine Learning Can Predict Videoconference Fluidity and Enjoyment

Scaling Efficient LLMs

Piano Transcription by Hierarchical Language Modeling with Pretrained Roll-based Encoders

Lived Experience Not Found: LLMs Struggle to Align with Experts on Addressing Adverse Drug Reactions from Psychiatric Medication Use

Samba-ASR: State-Of-The-Art Speech Recognition Leveraging Structured State-Space Models

PRMBench: A Fine-grained and Challenging Benchmark for Process-Level Reward Models

VideoAnydoor: High-fidelity Video Object Insertion with Precise Motion Control

CONTINUUM: Detecting APT Attacks through Spatial-Temporal Graph Neural Networks

LightGNN: Simple Graph Neural Network for Recommendation

最近の投稿

最近のコメント

アーカイブ

カテゴリー