-
最近の投稿
- 3D-AffordanceLLM: Harnessing Large Language Models for Open-Vocabulary Affordance Detection in 3D Worlds
- Towards Generalizable Vision-Language Robotic Manipulation: A Benchmark and LLM-guided 3D Policy
- Haptic-ACT: Bridging Human Intuition with Compliant Robotic Manipulation via Immersive VR
- Task-Aware Robotic Grasping by evaluating Quality Diversity Solutions through Foundation Models
- VDT-Auto: End-to-end Autonomous Driving with VLM-Guided Diffusion Transformers
-
最近のコメント
表示できるコメントはありません。 cs.AI (34550) cs.CL (26107) cs.CR (2648) cs.CV (40395) cs.LG (39550) cs.RO (20192) cs.SY (3066) eess.IV (4803) eess.SY (3060) stat.ML (5206)
月別アーカイブ: 2024年3月
Investigating the Emergent Audio Classification Ability of ASR Foundation Models
要約 テキストおよびビジョン基盤モデルは、ゼロショット設定で多くのタスクを実行で … 続きを読む
カテゴリー: cs.CL
Investigating the Emergent Audio Classification Ability of ASR Foundation Models はコメントを受け付けていません
Improving Adversarial Data Collection by Supporting Annotators: Lessons from GAHD, a German Hate Speech Dataset
要約 ヘイトスピーチ検出モデルの性能は、トレーニングに使用されたデータによって決 … 続きを読む
カテゴリー: cs.CL
Improving Adversarial Data Collection by Supporting Annotators: Lessons from GAHD, a German Hate Speech Dataset はコメントを受け付けていません
Promptly Predicting Structures: The Return of Inference
要約 プロンプトベースの手法は、ゼロショットおよび少数ショットのラベル予測子を構 … 続きを読む
カテゴリー: cs.CL
Promptly Predicting Structures: The Return of Inference はコメントを受け付けていません
Asymmetric and trial-dependent modeling: the contribution of LIA to SdSV Challenge Task 2
要約 SdSv チャレンジのタスク 2 は、最新のテキストに依存しない話者検証シ … 続きを読む
IVLMap: Instance-Aware Visual Language Grounding for Consumer Robot Navigation
要約 視覚と言語のナビゲーション (VLN) は、ロボットが人間の自然言語の指示 … 続きを読む
Dataverse: Open-Source ETL (Extract, Transform, Load) Pipeline for Large Language Models
要約 大規模なデータ処理に関連する課題に対処するために、私たちは、ユーザーフレン … 続きを読む
Intelligent Classification and Personalized Recommendation of E-commerce Products Based on Machine Learning
要約 インターネットの急速な進化と情報の急激な増加に伴い、ユーザーは情報過多と選 … 続きを読む
Breaking the Length Barrier: LLM-Enhanced CTR Prediction in Long Textual User Behaviors
要約 大規模言語モデル (LLM) の台頭により、最近の研究では LLM を活用 … 続きを読む
NIGHT — Non-Line-of-Sight Imaging from Indirect Time of Flight Data
要約 カメラの視線外の物体の取得は、非常に興味深いものですが、非常に挑戦的な研究 … 続きを読む
TimeChat: A Time-sensitive Multimodal Large Language Model for Long Video Understanding
要約 この研究では、長時間のビデオを理解するために特別に設計された、時間に敏感な … 続きを読む