-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CL」カテゴリーアーカイブ
Mini-batch Coresets for Memory-efficient Training of Large Language Models
要約 より大きなミニバッチを使用してトレーニングすると、収束率が向上し、優れたパ … 続きを読む
DelTA: An Online Document-Level Translation Agent Based on Multi-Level Memory
要約 大規模言語モデル (LLM) は、機械翻訳 (MT) の品質を合理的に向上 … 続きを読む
Sample then Identify: A General Framework for Risk Control and Assessment in Multimodal Large Language Models
要約 マルチモーダル大規模言語モデル (MLLM) は、さまざまなタスクにわたっ … 続きを読む
$\textbf{PLUM}$: Improving Code LMs with Execution-Guided On-Policy Preference Learning Driven By Synthetic Test Cases
要約 優先学習は、正しいコードと間違ったコードを区別するようにモデルが明示的にト … 続きを読む
From Exploration to Mastery: Enabling LLMs to Master Tools via Self-Driven Interactions
要約 ツール学習により、大規模言語モデル (LLM) はツールを呼び出して外部環 … 続きを読む
PaliGemma: A versatile 3B VLM for transfer
要約 PaliGemma は、SigLIP-So400m ビジョン エンコーダと … 続きを読む
Insight Over Sight? Exploring the Vision-Knowledge Conflicts in Multimodal LLMs
要約 この論文では、視覚情報がモデルの内部常識知識と矛盾する、マルチモーダル大規 … 続きを読む
Agent S: An Open Agentic Framework that Uses Computers Like a Human
要約 Agent S は、グラフィカル ユーザー インターフェイス (GUI) … 続きを読む
MRAG-Bench: Vision-Centric Evaluation for Retrieval-Augmented Multimodal Models
要約 既存のマルチモーダル検索ベンチマークは、モデルが外部のテキスト知識を取得し … 続きを読む
MathCoder2: Better Math Reasoning from Continued Pretraining on Model-translated Mathematical Code
要約 コードは、その精度と精度により、大規模な言語モデルの数学的推論能力を強化す … 続きを読む