-
最近の投稿
- Histogram-based Parameter-efficient Tuning for Passive Sonar Classification
- Learning to Reason under Off-Policy Guidance
- Understanding LLM Behaviors via Compression: Data Generation, Knowledge Acquisition and Scaling Laws
- Distribution-aware Forgetting Compensation for Exemplar-Free Lifelong Person Re-identification
- Synergistic Weak-Strong Collaboration by Aligning Preferences
-
最近のコメント
表示できるコメントはありません。 cs.AI (36907) cs.CL (27937) cs.CV (42681) cs.HC (2822) cs.LG (41846) cs.RO (21846) cs.SY (3324) eess.IV (4979) eess.SY (3316) stat.ML (5475)
「cs.MM」カテゴリーアーカイブ
Flight Patterns for Swarms of Drones
要約 ドローンの群れが 1 つ以上の開口部を衝突せずに通過するための飛行パターン … 続きを読む
A Benchmark and Robustness Study of In-Context-Learning with Large Language Models in Music Entity Detection
要約 曲のタイトルやアーティスト名などの音楽エンティティの検出は、音楽検索クエリ … 続きを読む
Wills Aligner: Multi-Subject Collaborative Brain Visual Decoding
要約 人間の脳活動から視覚情報を解読することは、最近の研究で目覚ましい進歩を遂げ … 続きを読む
IRR: Image Review Ranking Framework for Evaluating Vision-Language Models
要約 大規模ビジョン言語モデル (LVLM) は、画像とテキストの両方を処理し、 … 続きを読む
EVOS: Efficient Implicit Neural Training via EVOlutionary Selector
要約 私たちは、Implicit Neural Representation ( … 続きを読む
Low-Latency Scalable Streaming for Event-Based Vision
要約 最近、高速、低消費電力のビデオ キャプチャ用の新しい「イベントベース」カメ … 続きを読む
DriveMM: All-in-One Large Multimodal Model for Autonomous Driving
要約 大規模マルチモーダル モデル (LMM) は、大規模な言語モデルを組み込む … 続きを読む
DriveMM: All-in-One Large Multimodal Model for Autonomous Driving
要約 大規模マルチモーダル モデル (LMM) は、大規模な言語モデルを組み込む … 続きを読む
Towards Open-Vocabulary Video Semantic Segmentation
要約 ビデオのセマンティック セグメンテーションは、最近の研究の焦点となっていま … 続きを読む