-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
LargeAD: Large-Scale Cross-Sensor Data Pretraining for Autonomous Driving
要約 ビジョン基盤モデル (VFM) の最近の進歩により、2D の視覚認識に革命 … 続きを読む
Multimodal Machine Learning Can Predict Videoconference Fluidity and Enjoyment
要約 ビデオ会議は現在、仕事上でも非公式でも頻繁に行われるコミュニケーション手段 … 続きを読む
Scaling Efficient LLMs
要約 トレーニングされた LLM は通常、ほとんどのパラメーターがゼロであるため … 続きを読む
Piano Transcription by Hierarchical Language Modeling with Pretrained Roll-based Encoders
要約 生のオーディオから音符を取得することを目的とした自動音楽転写 (AMT) … 続きを読む
Lived Experience Not Found: LLMs Struggle to Align with Experts on Addressing Adverse Drug Reactions from Psychiatric Medication Use
要約 精神科治療薬による薬物副作用(ADR)は、メンタルヘルス患者の入院の主な原 … 続きを読む
Samba-ASR: State-Of-The-Art Speech Recognition Leveraging Structured State-Space Models
要約 私たちは、状態空間モデル (SSM) の基礎に基づいて構築された、新しい … 続きを読む
PRMBench: A Fine-grained and Challenging Benchmark for Process-Level Reward Models
要約 プロセス レベルの報酬モデル (PRM) は、複雑な推論および意思決定タス … 続きを読む
VideoAnydoor: High-fidelity Video Object Insertion with Precise Motion Control
要約 ビデオ生成は大幅に進歩しましたが、特定のオブジェクトをビデオに挿入すること … 続きを読む
カテゴリー: cs.CV
VideoAnydoor: High-fidelity Video Object Insertion with Precise Motion Control はコメントを受け付けていません
CONTINUUM: Detecting APT Attacks through Spatial-Temporal Graph Neural Networks
要約 Advanced Persistent Threat (APT) は、その … 続きを読む
LightGNN: Simple Graph Neural Network for Recommendation
要約 グラフ ニューラル ネットワーク (GNN) は、高次表現のスムージングを … 続きを読む