-
最近の投稿
- Physical Reservoir Computing in Hook-Shaped Rover Wheel Spokes for Real-Time Terrain Identification
- Chain-of-Modality: Learning Manipulation Programs from Multimodal Human Videos with Vision-Language-Models
- Multi-Sensor Fusion-Based Mobile Manipulator Remote Control for Intelligent Smart Home Assistance
- Integration of a Graph-Based Path Planner and Mixed-Integer MPC for Robot Navigation in Cluttered Environments
- Demonstrating CavePI: Autonomous Exploration of Underwater Caves by Semantic Guidance
-
最近のコメント
表示できるコメントはありません。 cs.AI (36829) cs.CL (27883) cs.CV (42623) cs.HC (2814) cs.LG (41781) cs.RO (21795) cs.SY (3320) eess.IV (4979) eess.SY (3312) stat.ML (5469)
「cs.IR」カテゴリーアーカイブ
CaReBench: A Fine-Grained Benchmark for Video Captioning and Retrieval
要約 ビデオキャプションや検索を含むビデオの理解は、ビデオ言語モデル(VLM)に … 続きを読む
Knowledge-Aware Iterative Retrieval for Multi-Agent Systems
要約 動的に進化する知識を活用することにより、クエリを繰り返し洗練し、コンテキス … 続きを読む
OASIS: Order-Augmented Strategy for Improved Code Search
要約 コード埋め込みは、コードのセマンティック表現をキャプチャし、コード検索など … 続きを読む
When Text Embedding Meets Large Language Model: A Comprehensive Survey
要約 テキストの埋め込みは、深い学習時代に自然言語処理(NLP)の基礎技術となっ … 続きを読む
GBSVR: Granular Ball Support Vector Regression
要約 サポートベクトル回帰(SVR)とそのバリアントは、回帰タスクの処理に広く使 … 続きを読む
Learning Cascade Ranking as One Network
要約 Cascadeランキングは、推奨プラットフォームや広告プラットフォームなど … 続きを読む
Quality Over Quantity? LLM-Based Curation for a Data-Efficient Audio-Video Foundation Model
要約 マルチモーダルの基礎モデルをトレーニングするためのオーディオとビジュアルデ … 続きを読む
xVLM2Vec: Adapting LVLM-based embedding models to multilinguality using Self-Knowledge Distillation
要約 現在の文献では、ほとんどの埋め込みモデルは、エンコーダーのみのトランスアー … 続きを読む
Towards Next-Generation Recommender Systems: A Benchmark for Personalized Recommendation Assistant with LLMs
要約 推奨システム(RECSYS)は、さまざまな最新のデジタルプラットフォームで … 続きを読む
Search-R1: Training LLMs to Reason and Leverage Search Engines with Reinforcement Learning
要約 大規模な言語モデル(LLM)の効果的な推論とテキスト生成には、外部の知識と … 続きを読む