-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CL」カテゴリーアーカイブ
AdaptAgent: Adapting Multimodal Web Agents with Few-Shot Learning from Human Demonstrations
要約 マルチモーダル大規模言語モデル (MLLM) を活用した最先端のマルチモー … 続きを読む
LIMBA: An Open-Source Framework for the Preservation and Valorization of Low-Resource Languages using Generative Models
要約 少数言語は文化遺産の保存に不可欠ですが、限られたデジタルリソースと高リソー … 続きを読む
PatentEdits: Framing Patent Novelty as Textual Entailment
要約 米国特許庁 (USPTO) によって特許が付与されるためには、特許が新規か … 続きを読む
Utilizing Large Language Models to Synthesize Product Desirability Datasets
要約 この研究では、ユーザー感情と製品エクスペリエンスを評価する際の重要なコンポ … 続きを読む
Advancing Complex Medical Communication in Arabic with Sporo AraSum: Surpassing Existing Large Language Models
要約 医療における多言語機能への需要の高まりは、特に臨床文書作成や意思決定におい … 続きを読む
Basic syntax from speech: Spontaneous concatenation in unsupervised deep neural networks
要約 構文の計算モデルは主にテキストベースです。 ここで私たちは、構文の進化にお … 続きを読む
Mono-InternVL: Pushing the Boundaries of Monolithic Multimodal Large Language Models with Endogenous Visual Pre-training
要約 このペーパーでは、ビジュアル エンコーディングと言語デコーディングを単一の … 続きを読む
VideoAutoArena: An Automated Arena for Evaluating Large Multimodal Models in Video Analysis through User Simulation
要約 高度なビデオ分析機能を備えた大規模マルチモーダル モデル (LMM) が、 … 続きを読む
Unification of Balti and trans-border sister dialects in the essence of LLMs and AI Technology
要約 バルティと呼ばれる言語は、中国・チベット語族、特にチベット・ビルマ語族に属 … 続きを読む
Neon: News Entity-Interaction Extraction for Enhanced Question Answering
要約 ほぼリアルタイムで新鮮な情報を取得し、それを使用して既存の大規模言語モデル … 続きを読む