-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CL」カテゴリーアーカイブ
Text2Data: Low-Resource Data Generation with Textual Control
要約 自然言語は、人間が機械とシームレスに対話するための共通かつ直接的な信号とし … 続きを読む
MEDEC: A Benchmark for Medical Error Detection and Correction in Clinical Notes
要約 いくつかの研究では、大規模言語モデル (LLM) が医療質問に正確に回答で … 続きを読む
Personalized Lip Reading: Adapting to Your Unique Lip Movements with Vision and Language
要約 読唇術は、唇の動きを分析することで話し言葉を予測することを目的としています … 続きを読む
MLVU: Benchmarking Multi-task Long Video Understanding
要約 Long Video Understanding (LVU) パフォーマン … 続きを読む
Refining Skewed Perceptions in Vision-Language Models through Visual Representations
要約 CLIP などの大規模ビジョン言語モデル (VLM) は基盤となり、さまざ … 続きを読む
VLM2Vec: Training Vision-Language Models for Massive Multimodal Embedding Tasks
要約 埋め込みモデルは、意味的類似性、情報検索、クラスタリングなどのさまざまな下 … 続きを読む
Ethical-Lens: Curbing Malicious Usages of Open-Source Text-to-Image Models
要約 Midjourney や DALLE 3 などのイノベーションに代表される … 続きを読む
MaPPER: Multimodal Prior-guided Parameter Efficient Tuning for Referring Expression Comprehension
要約 自然言語を介して局所的な視覚領域を定着させることを目的とした参照式理解 ( … 続きを読む
MMEvol: Empowering Multimodal Large Language Models with Evol-Instruct
要約 マルチモーダル大規模言語モデル (MLLM) の開発は、さまざまな分野 ( … 続きを読む
カテゴリー: cs.CL
MMEvol: Empowering Multimodal Large Language Models with Evol-Instruct はコメントを受け付けていません
HUNYUANPROVER: A Scalable Data Synthesis Framework and Guided Tree Search for Automated Theorem Proving
要約 LEAN4 を使用した対話型自動定理証明用に Hunyuan 7B から微 … 続きを読む