-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
What’s the Difference? Supporting Users in Identifying the Effects of Prompt and Model Changes Through Token Patterns
要約 大規模な言語モデルの迅速なエンジニアリングは挑戦的です。小さな迅速な摂動や … 続きを読む
Fine-tuning Whisper on Low-Resource Languages for Real-World Applications
要約 このペーパーでは、Swissドイツ語をケーススタディとして使用して、文レベ … 続きを読む
Pre-DPO: Improving Data Utilization in Direct Preference Optimization Using a Guiding Reference Model
要約 直接選好最適化(DPO)は、明示的な報酬モデルなしで人間の好みを最適化する … 続きを読む
カテゴリー: cs.CL
Pre-DPO: Improving Data Utilization in Direct Preference Optimization Using a Guiding Reference Model はコメントを受け付けていません
Exploring Cognitive and Aesthetic Causality for Multimodal Aspect-Based Sentiment Analysis
要約 マルチモーダルアスペクトベースのセンチメント分類(MASC)は、特定のアス … 続きを読む
カテゴリー: cs.CL
Exploring Cognitive and Aesthetic Causality for Multimodal Aspect-Based Sentiment Analysis はコメントを受け付けていません
Aggregating Soft Labels from Crowd Annotations Improves Uncertainty Estimation Under Distribution Shift
要約 機械学習タスクの効果的なトレーニング信号を選択することは困難です。専門家の … 続きを読む
カテゴリー: cs.CL
Aggregating Soft Labels from Crowd Annotations Improves Uncertainty Estimation Under Distribution Shift はコメントを受け付けていません
SARI: Structured Audio Reasoning via Curriculum-Guided Reinforcement Learning
要約 最近の研究は、Rehnecortion Learning(RL)が、「答え … 続きを読む
カテゴリー: cs.CL
SARI: Structured Audio Reasoning via Curriculum-Guided Reinforcement Learning はコメントを受け付けていません
On the Low-Rank Parametrization of Reward Models for Controlled Language Generation
要約 大量のデータで訓練された言語モデルは、場合によっては不適切なコンテンツを生 … 続きを読む
カテゴリー: cs.CL
On the Low-Rank Parametrization of Reward Models for Controlled Language Generation はコメントを受け付けていません
Open-World Evaluation for Retrieving Diverse Perspectives
要約 複雑で論争の多い質問に関するさまざまな視点をカバーする一連のドキュメントの … 続きを読む
Optimizing RLHF Training for Large Language Models with Stage Fusion
要約 人間のフィードバック(RLHF)からの補強学習のための段階的融合を備えた効 … 続きを読む
SWITCH: Studying with Teacher for Knowledge Distillation of Large Language Models
要約 大規模な言語モデル(LLMS)の成功にもかかわらず、彼らは依然として高い推 … 続きを読む
カテゴリー: cs.CL
SWITCH: Studying with Teacher for Knowledge Distillation of Large Language Models はコメントを受け付けていません