-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年7月
The formation of perceptual space in early phonetic acquisition: a cross-linguistic modeling approach
要約 この研究では、2 つの重要な側面で以前の研究を進めることにより、学習者が初 … 続きを読む
The Janus Interface: How Fine-Tuning in Large Language Models Amplifies the Privacy Risks
要約 大規模言語モデル (LLM) の急速な進歩により、その広範なトレーニング … 続きを読む
Is larger always better? Evaluating and prompting large language models for non-generative medical tasks
要約 医療における大規模言語モデル (LLM) の使用は増加していますが、構造化 … 続きを読む
AIR-Bench: Benchmarking Large Audio-Language Models via Generative Comprehension
要約 最近、指示に従う音声言語モデルが、人間と音声のインタラクションとして広く注 … 続きを読む
Grounding Language Models for Visual Entity Recognition
要約 視覚的エンティティ認識のための自己回帰モデルである AutoVER を紹介 … 続きを読む
Towards a Multidimensional Evaluation Framework for Empathetic Conversational Systems
要約 共感会話システム (ECS) は、アプリケーション ドメインに関係なく、ユ … 続きを読む
A Universal Prompting Strategy for Extracting Process Model Information from Natural Language Text using Large Language Models
要約 過去 10 年間にわたり、テキストによるプロセス記述から情報を抽出すること … 続きを読む
3MVRD: Multimodal Multi-task Multi-teacher Visually-Rich Form Document Understanding
要約 この論文では、視覚的に豊富な形式の文書を理解するための、画期的なマルチモー … 続きを読む
Multimodal Emotion Recognition using Audio-Video Transformer Fusion with Cross Attention
要約 感情を理解することは、人間のコミュニケーションの基本的な側面です。 オーデ … 続きを読む
Learning Robust Named Entity Recognizers From Noisy Data With Retrieval Augmentation
要約 固有表現認識 (NER) モデルは、スペルミスや光学式文字認識プロセスによ … 続きを読む