-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CL」カテゴリーアーカイブ
Disability Representations: Finding Biases in Automatic Image Generation
要約 画像生成技術の最近の進歩により、AI 生成画像への広範なアクセスが可能にな … 続きを読む
AlanaVLM: A Multimodal Embodied AI Foundation Model for Egocentric Video Understanding
要約 ロボットやウェアラブルを介して導入される AI パーソナル アシスタントに … 続きを読む
Tri-VQA: Triangular Reasoning Medical Visual Question Answering for Multi-Attribute Analysis
要約 Medical Visual Question Answering (Me … 続きを読む
Investigating the impact of 2D gesture representation on co-speech gesture generation
要約 共同スピーチジェスチャーは、人間と身体的会話エージェント (ECA) との … 続きを読む
AGLA: Mitigating Object Hallucinations in Large Vision-Language Models with Assembly of Global and Local Attention
要約 大規模視覚言語モデル (LVLM) は、さまざまなマルチモーダル タスクで … 続きを読む
Multimodal Task Vectors Enable Many-Shot Multimodal In-Context Learning
要約 少数ショット学習におけるインターリーブ大規模マルチモーダル モデル (LM … 続きを読む
FVEL: Interactive Formal Verification Environment with Large Language Models via Theorem Proving
要約 形式検証 (FV) は、進化する大規模言語モデル (LLM) による現在の … 続きを読む
Infusing clinical knowledge into tokenisers for language models
要約 この研究では、臨床テキスト処理のための新しい知識強化型トークン化メカニズム … 続きを読む
Robust Few-shot Transfer Learning for Knowledge Base Question Answering with Unanswerable Questions
要約 実際の KBQA アプリケーションには、(1) 堅牢なモデル (回答可能な … 続きを読む
Identifying User Goals from UI Trajectories
要約 グラフィカル ユーザー インターフェイス (GUI) と対話する自律エージ … 続きを読む