-
最近の投稿
- Agent-Based Emulation for Deploying Robot Swarm Behaviors
- Automated Planning Domain Inference for Task and Motion Planning
- Tactile Displays Driven by Projected Light
- Caging in Time: A Framework for Robust Object Manipulation under Uncertainties and Limited Robot Perception
- Implicit Contact Diffuser: Sequential Contact Reasoning with Latent Point Cloud Diffusion
-
最近のコメント
表示できるコメントはありません。 cs.AI (28464) cs.CL (21516) cs.CR (2224) cs.CV (35088) cs.LG (33220) cs.RO (16420) cs.SY (2528) eess.IV (4274) eess.SY (2522) stat.ML (4457)
月別アーカイブ: 2024年6月
M3T: A New Benchmark Dataset for Multi-Modal Document-Level Machine Translation
要約 ドキュメントの翻訳は、ニューラル機械翻訳 (NMT) システムにとって課題 … 続きを読む
カテゴリー: cs.CL
M3T: A New Benchmark Dataset for Multi-Modal Document-Level Machine Translation はコメントを受け付けていません
Agent-SiMT: Agent-assisted Simultaneous Machine Translation with Large Language Models
要約 同時機械翻訳 (SiMT) は、原文を読みながらターゲットの翻訳を生成しま … 続きを読む
カテゴリー: cs.CL
Agent-SiMT: Agent-assisted Simultaneous Machine Translation with Large Language Models はコメントを受け付けていません
Auto Arena of LLMs: Automating LLM Evaluations with Agent Peer-battles and Committee Discussions
要約 LLM は日々進化するため、堅牢な評価結果をタイムリーに提供できる、信頼で … 続きを読む
カテゴリー: cs.CL
Auto Arena of LLMs: Automating LLM Evaluations with Agent Peer-battles and Committee Discussions はコメントを受け付けていません
Speech Emotion Recognition with ASR Transcripts: A Comprehensive Study on Word Error Rate and Fusion Techniques
要約 テキスト データは一般に、音声感情認識 (SER) のパフォーマンスと信頼 … 続きを読む
Chinese MentalBERT: Domain-Adaptive Pre-training on Social Media for Chinese Mental Health Text Analysis
要約 現在の環境では、心理的な問題が蔓延し、広範囲にわたっており、ソーシャルメデ … 続きを読む
Multiple-Choice Questions are Efficient and Robust LLM Evaluators
要約 60 のオープンソース モデルから GSM8K と MATH に関する回答 … 続きを読む
カテゴリー: cs.CL
Multiple-Choice Questions are Efficient and Robust LLM Evaluators はコメントを受け付けていません
Towards Unsupervised Speech Recognition Without Pronunciation Models
要約 教師あり自動音声認識 (ASR) の最近の進歩は、主に大規模な書き起こされ … 続きを読む
Understanding Sounds, Missing the Questions: The Challenge of Object Hallucination in Large Audio-Language Models
要約 大規模音声言語モデル (LALM) は、音声認識機能を統合することで従来の … 続きを読む
FIFO-Diffusion: Generating Infinite Videos from Text without Training
要約 テキスト条件付きビデオ生成のための事前トレーニング済み拡散モデルに基づく新 … 続きを読む
A deep cut into Split Federated Self-supervised Learning
要約 協調的な自己教師あり学習は、最近、クライアント デバイスと中央サーバーの間 … 続きを読む