-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
LogogramNLP: Comparing Visual and Textual Representations of Ancient Logographic Writing Systems for NLP
要約 標準の自然言語処理 (NLP) パイプラインは、通常、一連の離散トークンで … 続きを読む
Puppet-Master: Scaling Interactive Video Generation as a Motion Prior for Part-Level Dynamics
要約 パーツレベルのダイナミクスの事前モーションとして機能するインタラクティブな … 続きを読む
Arctic-TILT. Business Document Understanding at Sub-Billion Scale
要約 LLM を採用するワークロードの大部分には、PDF またはスキャン コンテ … 続きを読む
LiDAR-Event Stereo Fusion with Hallucinations
要約 イベント ステレオ マッチングは、ニューロモーフィック カメラから深度を推 … 続きを読む
カテゴリー: cs.CV
LiDAR-Event Stereo Fusion with Hallucinations はコメントを受け付けていません
ESP-MedSAM: Efficient Self-Prompting SAM for Universal Domain-Generalized Image Segmentation
要約 さまざまなモダリティにわたるディープ ニューラル ネットワークの普遍性と、 … 続きを読む
SynopGround: A Large-Scale Dataset for Multi-Paragraph Video Grounding from TV Dramas and Synopses
要約 ビデオ グラウンディングは、マルチモーダル コンテンツの理解における基本的 … 続きを読む
Compression-Realized Deep Structural Network for Video Quality Enhancement
要約 このペーパーでは、圧縮ビデオの品質向上のタスクに焦点を当てます。 ディープ … 続きを読む
Advancing Prompt Learning through an External Layer
要約 プロンプト学習は、一連のテキスト埋め込みを学習することで、事前トレーニング … 続きを読む
カテゴリー: cs.CV
Advancing Prompt Learning through an External Layer はコメントを受け付けていません
SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries
要約 自動運転車計画アルゴリズムのパフォーマンスを評価するには、ロングテールの安 … 続きを読む
Opening the Black Box of 3D Reconstruction Error Analysis with VECTOR
要約 2D 画像から 3D シーンを再構成することは、地球惑星科学や宇宙探査から … 続きを読む