-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CL」カテゴリーアーカイブ
ReSpark: Leveraging Previous Data Reports as References to Generate New Reports with LLMs
要約 データレポートの作成は、データの探索と理解を繰り返し、その後に洞察を要約す … 続きを読む
AlphaSharpe: LLM-Driven Discovery of Robust Risk-Adjusted Metrics
要約 シャープレシオのような財務指標は、リスクとリターンのバランスを取ることによ … 続きを読む
Boosting Multimodal Reasoning with MCTS-Automated Structured Thinking
要約 マルチモーダル大規模言語モデル(MLLM)は印象的な能力を示すが、複雑な視 … 続きを読む
カテゴリー: cs.CL
Boosting Multimodal Reasoning with MCTS-Automated Structured Thinking はコメントを受け付けていません
Premise-Augmented Reasoning Chains Improve Error Identification in Math reasoning with LLMs
要約 Chain-of-Thought(CoT)プロンプトは、詳細なステップバイ … 続きを読む
カテゴリー: cs.CL
Premise-Augmented Reasoning Chains Improve Error Identification in Math reasoning with LLMs はコメントを受け付けていません
STAIR: Improving Safety Alignment with Introspective Reasoning
要約 大規模言語モデル(LLM)の安全性と無害性を保証することは、アプリケーショ … 続きを読む
カテゴリー: cs.CL
STAIR: Improving Safety Alignment with Introspective Reasoning はコメントを受け付けていません
Avoiding spurious sharpness minimization broadens applicability of SAM
要約 Sharpness Aware Minimization (SAM)のよう … 続きを読む
Plan*RAG: Efficient Test-Time Planning for Retrieval Augmented Generation
要約 本論文では、Plan*RAGを紹介する。Plan*RAGは、テスト時間の推 … 続きを読む
MILU: A Multi-task Indic Language Understanding Benchmark
要約 低リソースで言語的に多様な言語における大規模言語モデル(LLM)の評価は、 … 続きを読む
カテゴリー: cs.CL
MILU: A Multi-task Indic Language Understanding Benchmark はコメントを受け付けていません
Is poisoning a real threat to LLM alignment? Maybe more so than you think
要約 人間のフィードバックを伴う強化学習(RLHF)の最近の進歩は、大規模言語モ … 続きを読む
SimPER: A Minimalist Approach to Preference Alignment without Hyperparameters
要約 言語モデルのアライメントのための既存のプリファレンス最適化目標では、最適な … 続きを読む