-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年6月
LASER: Learning by Aligning Self-supervised Representations of Speech for Improving Content-related Tasks
要約 自己教師あり学習 (SSL) ベースの音声モデルは、フルスタックの音声処理 … 続きを読む
Diffusion Gaussian Mixture Audio Denoise
要約 最近の拡散モデルは、オーディオのノイズ除去タスクにおいて有望なパフォーマン … 続きを読む
DefAn: Definitive Answer Dataset for LLMs Hallucination Evaluation
要約 大規模言語モデル (LLM) は驚くべき機能を実証し、日常生活のアプリケー … 続きを読む
Test of Time: A Benchmark for Evaluating LLMs on Temporal Reasoning
要約 大規模言語モデル (LLM) は、優れた推論能力を示していますが、特に複雑 … 続きを読む
カテゴリー: cs.CL
Test of Time: A Benchmark for Evaluating LLMs on Temporal Reasoning はコメントを受け付けていません
ReMI: A Dataset for Reasoning with Multiple Images
要約 大規模言語モデル (LLM) は継続的に進歩しているため、その拡張機能を効 … 続きを読む
Orthogonality and isotropy of speaker and phonetic information in self-supervised speech representations
要約 自己教師付き音声表現は、下流の音声技術に多大な利益をもたらしますが、それを … 続きを読む
カテゴリー: cs.CL
Orthogonality and isotropy of speaker and phonetic information in self-supervised speech representations はコメントを受け付けていません
Language Complexity and Speech Recognition Accuracy: Orthographic Complexity Hurts, Phonological Complexity Doesn’t
要約 どのような言語的要因が自動音声認識 (ASR) モデルのパフォーマンスに影 … 続きを読む
MMMU: A Massive Multi-discipline Multimodal Understanding and Reasoning Benchmark for Expert AGI
要約 MMMU を紹介します。MMMU は、大学レベルの主題知識と慎重な推論を必 … 続きを読む
ReadCtrl: Personalizing text generation with readability-controlled instruction learning
要約 ユーザーの読みやすさを条件にしたコンテンツ生成は、パーソナライゼーションの … 続きを読む
Active Learning for Multilingual Fingerspelling Corpora
要約 私たちはアクティブ ラーニングを適用して、手話のデータ不足の問題を解決しま … 続きを読む