-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年7月
Is the Digital Forensics and Incident Response Pipeline Ready for Text-Based Threats in LLM Era?
要約 生成 AI の時代において、ニューラル テキスト ジェネレーター (NTG … 続きを読む
Improving Domain-Specific ASR with LLM-Generated Contextual Descriptions
要約 エンドツーエンドの自動音声認識 (E2E ASR) システムは、広範なデー … 続きを読む
A Large-Scale Sensitivity Analysis on Latent Embeddings and Dimensionality Reductions for Text Spatializations
要約 テキスト コーパスのドキュメント間の意味上の類似性は、2 次元の散布図レイ … 続きを読む
KIVI: A Tuning-Free Asymmetric 2bit Quantization for KV Cache
要約 大規模言語モデル (LLM) を効率的に処理するには、リクエストあたりのコ … 続きを読む
Large Language Models Understand Layout
要約 大規模言語モデル (LLM) は、幅広い自然言語処理 (NLP) タスクに … 続きを読む
カテゴリー: cs.CL
Large Language Models Understand Layout はコメントを受け付けていません
AutoRE: Document-Level Relation Extraction with Large Language Models
要約 大規模言語モデル (LLM) は、テキストの理解と生成において優れた能力を … 続きを読む
The Power of Combining Data and Knowledge: GPT-4o is an Effective Interpreter of Machine Learning Models in Predicting Lymph Node Metastasis of Lung Cancer
要約 リンパ節転移 (LNM) は肺がん患者の初期治療を決定する重要な要素ですが … 続きを読む
Modelling Multimodal Integration in Human Concept Processing with Vision-and-Language Models
要約 ディープ ニューラル ネットワーク (DNN) からの表現は、視覚処理と言 … 続きを読む
カテゴリー: cs.CL
Modelling Multimodal Integration in Human Concept Processing with Vision-and-Language Models はコメントを受け付けていません
The Curious Case of Representational Alignment: Unravelling Visio-Linguistic Tasks in Emergent Communication
要約 自然言語には、構成的であり、現実に基づいているという普遍的な特性があります … 続きを読む
カテゴリー: cs.CL
The Curious Case of Representational Alignment: Unravelling Visio-Linguistic Tasks in Emergent Communication はコメントを受け付けていません
What does Kiki look like? Cross-modal associations between speech sounds and visual shapes in vision-and-language models
要約 人間は、特定の新しい単語を視覚的な形状に一致させるときに、明確なクロスモー … 続きを読む
カテゴリー: cs.CL
What does Kiki look like? Cross-modal associations between speech sounds and visual shapes in vision-and-language models はコメントを受け付けていません