-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CL」カテゴリーアーカイブ
Simple and Effective Masked Diffusion Language Models
要約 拡散モデルは高品質の画像の生成に優れていますが、以前の研究では、言語モデリ … 続きを読む
diff History for Neural Language Agents
要約 ニューラル言語モデル (LM) は、汎用の組み込み制御のための魅力的なソリ … 続きを読む
Open-LLM-Leaderboard: From Multi-choice to Open-style Questions for LLMs Evaluation, Benchmark, and Arena
要約 多肢選択質問 (MCQ) は、大規模言語モデル (LLM) を評価するため … 続きを読む
Toxic Memes: A Survey of Computational Perspectives on the Detection and Explanation of Meme Toxicities
要約 インターネット ミーム、ユーモア、社会的コメント、文化的表現のチャンネルは … 続きを読む
VideoLLaMA 2: Advancing Spatial-Temporal Modeling and Audio Understanding in Video-LLMs
要約 このペーパーでは、ビデオおよびオーディオ指向のタスクにおける時空間モデリン … 続きを読む
Image Textualization: An Automatic Framework for Creating Accurate and Detailed Image Descriptions
要約 画像記述データセットは、画像の理解、テキストから画像への生成、テキストから … 続きを読む
Situational Awareness Matters in 3D Vision Language Reasoning
要約 3D 空間で複雑な視覚言語推論タスクを実行できることは、家庭用ロボットや人 … 続きを読む
Commonsense-T2I Challenge: Can Text-to-Image Generation Models Understand Commonsense?
要約 我々は、Commonsense-T2Iと呼ぶ、実生活の常識に適合する画像を … 続きを読む
Self-Tuning: Instructing LLMs to Effectively Acquire New Knowledge through Self-Teaching
要約 大規模言語モデル (LLM) は、1 回限りのトレーニングと常に進化する世 … 続きを読む
カテゴリー: cs.CL
Self-Tuning: Instructing LLMs to Effectively Acquire New Knowledge through Self-Teaching はコメントを受け付けていません
mHuBERT-147: A Compact Multilingual HuBERT Model
要約 我々は、90,000 時間のクリーンなオープンライセンス データでトレーニ … 続きを読む