-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2023年8月
Bridging the Gap: Deciphering Tabular Data Using Large Language Model
要約 自然言語処理の分野では、表形式データの理解が常に学術研究の焦点となっていま … 続きを読む
Chain-of-Thought Prompt Distillation for Multimodal Named Entity Recognition and Multimodal Relation Extraction
要約 マルチモーダル固有表現認識 (MNER) とマルチモーダル関係抽出 (MR … 続きを読む
Audio Difference Captioning Utilizing Similarity-Discrepancy Disentanglement
要約 私たちは、類似しているがわずかに異なるオーディオ クリップの入力ペア間の意 … 続きを読む
A Structured Span Selector
要約 多くの自然言語処理タスク (共参照解決や意味論的役割のラベル付けなど) で … 続きを読む
Making first order linear logic a generating grammar
要約 さまざまなカテゴリ文法が一次乗算線形論理 (MLL1) のフラグメントで表 … 続きを読む
Audio Generation with Multiple Conditional Diffusion Model
要約 テキストベースのオーディオ生成モデルには、オーディオ内のすべての情報を網羅 … 続きを読む
Self-consistency for open-ended generations
要約 大規模言語モデル (LLM) では、サンプリングされた出力の品質にかなりの … 続きを読む
EVE: Efficient Vision-Language Pre-training with Masked Prediction and Modality-Aware MoE
要約 多様でマルチモーダルなデータから学習するためのスケーラブルなビジョン言語モ … 続きを読む
Topical-Chat: Towards Knowledge-Grounded Open-Domain Conversations
要約 人間とオープンドメインで深く魅力的な会話ができるソーシャルボットを構築する … 続きを読む
Graecia capta ferum victorem cepit. Detecting Latin Allusions to Ancient Greek Literature
要約 テクスト間の暗示は古典文献学において極めて重要な役割を果たしており、ラテン … 続きを読む