-
最近の投稿
- When ‘A Helpful Assistant’ Is Not Really Helpful: Personas in System Prompts Do Not Improve Performances of Large Language Models
- LayerKV: Optimizing Large Language Model Serving with Layer-wise KV Cache Management
- Learning an Actionable Discrete Diffusion Policy via Large-Scale Actionless Video Pre-Training
- LoTLIP: Improving Language-Image Pre-training for Long Text Understanding
- A Simulation-Free Deep Learning Approach to Stochastic Optimal Control
-
最近のコメント
表示できるコメントはありません。 cs.AI (27781) cs.CL (20995) cs.CR (2177) cs.CV (34496) cs.LG (32528) cs.RO (15919) cs.SY (2473) eess.IV (4231) eess.SY (2467) stat.ML (4356)
月別アーカイブ: 2024年2月
LaneSegNet: Map Learning with Lane Segment Perception for Autonomous Driving
要約 地図は、自動運転システムの下流アプリケーションにとって重要な情報として、通 … 続きを読む
カテゴリー: cs.CV
LaneSegNet: Map Learning with Lane Segment Perception for Autonomous Driving はコメントを受け付けていません
MM-SAP: A Comprehensive Benchmark for Assessing Self-Awareness of Multimodal Large Language Models in Perception
要約 マルチモーダル大規模言語モデル (MLLM) の最近の進歩により、視覚的な … 続きを読む
On Distributed Larger-Than-Memory Subset Selection With Pairwise Submodular Functions
要約 多くの学習問題は、サブセットの選択、つまり重要な代表点のサブセットを特定す … 続きを読む
Evaluating the Significance of Outdoor Advertising from Driver’s Perspective Using Computer Vision
要約 道路脇の看板などの屋外広告は、マーケティング キャンペーンにおいて重要な役 … 続きを読む
Supersampling of Data from Structured-light Scanner with Deep Learning
要約 この論文は、構造化光技術を使用して 3D カメラから取得される深度マップの … 続きを読む
Processing and Segmentation of Human Teeth from 2D Images using Weakly Supervised Learning
要約 歯のセグメンテーションは、正確な診断と治療計画を立てるための歯科画像解析に … 続きを読む
Knowledge Graphs Meet Multi-Modal Learning: A Comprehensive Survey
要約 ナレッジ グラフ (KG) は、さまざまな AI アプリケーションを進歩さ … 続きを読む
VOOM: Robust Visual Object Odometry and Mapping using Hierarchical Landmarks
要約 近年、オブジェクト指向同時ローカライゼーションおよびマッピング (SLAM … 続きを読む
Enhancing Representation in Medical Vision-Language Foundation Models via Multi-Scale Information Extraction Techniques
要約 医療視覚言語基盤モデルの開発は、さまざまな臨床応用での有望な可能性があるた … 続きを読む
カテゴリー: cs.CV
Enhancing Representation in Medical Vision-Language Foundation Models via Multi-Scale Information Extraction Techniques はコメントを受け付けていません
DCVSMNet: Double Cost Volume Stereo Matching Network
要約 我々は、2 つの小さな上位 (グループごと) コスト ボリュームと下位 ( … 続きを読む
カテゴリー: cs.CV
DCVSMNet: Double Cost Volume Stereo Matching Network はコメントを受け付けていません