-
最近の投稿
- Identifying and Addressing Delusions for Target-Directed Decision-Making
- Quanda: An Interpretability Toolkit for Training Data Attribution Evaluation and Beyond
- Context-Aware Command Understanding for Tabletop Scenarios
- Reliable Probabilistic Human Trajectory Prediction for Autonomous Applications
- Towards Realistic UAV Vision-Language Navigation: Platform, Benchmark, and Methodology
-
最近のコメント
表示できるコメントはありません。 cs.AI (27853) cs.CL (21045) cs.CR (2180) cs.CV (34557) cs.LG (32593) cs.RO (15973) cs.SY (2479) eess.IV (4238) eess.SY (2473) stat.ML (4364)
投稿者「jarxiv」のアーカイブ
AlphaIntegrator: Transformer Action Search for Symbolic Integration Proofs
要約 我々は、ステップバイステップの数学的統合のための、最初の正解学習ベースのシ … 続きを読む
Unsupervised Point Cloud Completion through Unbalanced Optimal Transport
要約 ペアリングされていない点群補完では、ペアリングされていない不完全な点群デー … 続きを読む
Rel-A.I.: An Interaction-Centered Approach To Measuring Human-LM Reliance
要約 不確実性、リスク、限界を伝える能力は、大規模言語モデルの安全性にとって極め … 続きを読む
FAN: Fourier Analysis Networks
要約 ニューラルネットワーク、特にMLPやTransformerに代表されるニュ … 続きを読む
CulturalBench: a Robust, Diverse and Challenging Benchmark on Measuring the (Lack of) Cultural Knowledge of LLMs
要約 大規模言語モデル(LLM)を多様な文化圏でより役立つものにするためには、進 … 続きを読む
Distilling an End-to-End Voice Assistant Without Instruction Training Data
要約 SiriやGoogleアシスタントのような音声アシスタントは、通常、音声と … 続きを読む
DailyDilemmas: Revealing Value Preferences of LLMs with Quandaries of Daily Life
要約 日常生活における意思決定のためにLLMのガイダンスを求めることが増えている … 続きを読む
User-centric Immersive Communications in 6G: A Data-oriented Approach via Digital Twin
要約 この論文では、6Gにおける没入型通信(IC)のための新しいユーザー中心のサ … 続きを読む
Discovering Clues of Spoofed LM Watermarks
要約 LLM透かしは、LLMで生成されたテキストの所有権を示す有望な方法として注 … 続きを読む
HELMET: How to Evaluate Long-Context Language Models Effectively and Thoroughly
要約 ロングコンテクスト言語モデル(LCLM)を評価するためのベンチマークは数多 … 続きを読む