-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CL」カテゴリーアーカイブ
S2-Attention: Hardware-Aware Context Sharding Among Attention Heads
要約 コンテキスト内のトークンのサブセットに選択的に注意を向ける、まばらな注意が … 続きを読む
カテゴリー: cs.CL
S2-Attention: Hardware-Aware Context Sharding Among Attention Heads はコメントを受け付けていません
Long Story Short: Story-level Video Understanding from 20K Short Films
要約 視覚言語モデルの最近の開発により、ビデオの理解が大幅に進歩しました。 ただ … 続きを読む
VideoRAG: Retrieval-Augmented Generation over Video Corpus
要約 検索拡張生成 (RAG) は、クエリに関連する外部知識を取得し、それを生成 … 続きを読む
Affordably Fine-tuned LLMs Provide Better Answers to Course-specific MCQs
要約 教育においては、大規模言語モデル (LLM) の人間に似たテキストを生成す … 続きを読む
Effective faking of verbal deception detection with target-aligned adversarial attacks
要約 背景: 言語の分析による欺瞞の検出は、人間の判断と自動化された機械学習の判 … 続きを読む
Addressing speaker gender bias in large scale speech translation systems
要約 この研究は、攻撃的で不正確な翻訳につながる可能性がある、音声翻訳 (ST) … 続きを読む
Are We Done with MMLU?
要約 たぶんそうではありません。 人気のある Massive Multitask … 続きを読む
How to Tune a Multilingual Encoder Model for Germanic Languages: A Study of PEFT, Full Fine-Tuning, and Language Adapters
要約 この論文では、mDeBERTas の事前トレーニング データにおけるさまざ … 続きを読む
Benchmarking Rotary Position Embeddings for Automatic Speech Recognition
要約 Rotary Position Embedding (RoPE) は、シー … 続きを読む
Fleurs-SLU: A Massively Multilingual Benchmark for Spoken Language Understanding
要約 最近の多言語自動音声認識モデルは数千の言語をサポートすると主張していますが … 続きを読む