-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CL」カテゴリーアーカイブ
Erasing Conceptual Knowledge from Language Models
要約 言語モデルにおける概念消去は、従来、包括的な評価の枠組みを欠いていたため、 … 続きを読む
Which questions should I answer? Salience Prediction of Inquisitive Questions
要約 探究的な質問(人が読書をする際にする、オープンエンドで好奇心主導の質問)は … 続きを読む
カテゴリー: cs.CL
Which questions should I answer? Salience Prediction of Inquisitive Questions はコメントを受け付けていません
MedVisionLlama: Leveraging Pre-Trained Large Language Model Layers to Enhance Medical Image Segmentation
要約 大規模言語モデル(Large Language Models: LLM)は … 続きを読む
NL-Eye: Abductive NLI for Images
要約 視覚言語モデル(VLM)ベースのボットは、床が濡れていることを検知したら、 … 続きを読む
Qwen2-VL: Enhancing Vision-Language Model’s Perception of the World at Any Resolution
要約 Qwen2-VLは、従来のQwen-VLをさらに進化させたモデルであり、従 … 続きを読む
Measuring and Improving Persuasiveness of Generative Models
要約 LLMは、人間が消費するコンテンツを生成するワークフロー(マーケティングな … 続きを読む
LLaVA-Critic: Learning to Evaluate Multimodal Models
要約 LLaVA-Criticを紹介する。LLaVA-Criticは、幅広いマル … 続きを読む
Video Instruction Tuning With Synthetic Data
要約 動画ラージ・マルチモーダルモデル(LMM)の開発は、ウェブから大量の高品質 … 続きを読む
Autoregressive Pre-Training on Pixels and Texts
要約 視覚情報とテキスト情報の統合は、言語モデルの進歩において有望な方向性を示し … 続きを読む
DivScene: Benchmarking LVLMs for Object Navigation with Diverse Scenes and Objects
要約 未知の環境におけるオブジェクトナビゲーションは、実世界のアプリケーションに … 続きを読む