-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年5月
Choose What You Need: Disentangled Representation Learning for Scene Text Recognition, Removal and Editing
要約 シーンテキスト画像には、スタイル情報(フォント、背景)だけでなく、コンテン … 続きを読む
カテゴリー: cs.CV
Choose What You Need: Disentangled Representation Learning for Scene Text Recognition, Removal and Editing はコメントを受け付けていません
$\textbf{Splat-MOVER}$: Multi-Stage, Open-Vocabulary Robotic Manipulation via Editable Gaussian Splatting
要約 我々は、オープンボキャブラリーロボット操作のためのモジュラーロボットスタッ … 続きを読む
DriveWorld: 4D Pre-trained Scene Understanding via World Models for Autonomous Driving
要約 ビジョン中心の自動運転は、コストが低いため、最近広く注目を集めています。 … 続きを読む
カテゴリー: cs.CV
DriveWorld: 4D Pre-trained Scene Understanding via World Models for Autonomous Driving はコメントを受け付けていません
BILTS: A novel bi-invariant local trajectory-shape descriptor for rigid-body motion
要約 動作と確立された動作モデルとの類似性を測定することは、動作の分析、認識、生 … 続きを読む
Deep Unlearning: Fast and Efficient Training-free Approach to Class Forgetting
要約 機械のアンラーニングは、ユーザーデータの削除に対する規制上の要求とプライバ … 続きを読む
Learning To See But Forgetting To Follow: Visual Instruction Tuning Makes LLMs More Prone To Jailbreak Attacks
要約 画像理解機能を備えた大規模言語モデル (LLM) の強化により、高性能の視 … 続きを読む
カテゴリー: cs.CV
Learning To See But Forgetting To Follow: Visual Instruction Tuning Makes LLMs More Prone To Jailbreak Attacks はコメントを受け付けていません
Vision Mamba: A Comprehensive Survey and Taxonomy
要約 状態空間モデル (SSM) は、動的システムの動作を記述および分析するため … 続きを読む
On Good Practices for Task-Specific Distillation of Large Pretrained Visual Models
要約 大規模な事前トレーニング済み視覚モデルは、さまざまな認識タスクにわたって顕 … 続きを読む
カテゴリー: cs.CV
On Good Practices for Task-Specific Distillation of Large Pretrained Visual Models はコメントを受け付けていません
DocRes: A Generalist Model Toward Unifying Document Image Restoration Tasks
要約 ドキュメント画像の品質は全体的なパフォーマンスに大きく影響するため、ドキュ … 続きを読む
カテゴリー: cs.CV
DocRes: A Generalist Model Toward Unifying Document Image Restoration Tasks はコメントを受け付けていません
DistGrid: Scalable Scene Reconstruction with Distributed Multi-resolution Hash Grid
要約 Neural Radiance Field~(NeRF) は、オブジェクト … 続きを読む
カテゴリー: cs.CV
DistGrid: Scalable Scene Reconstruction with Distributed Multi-resolution Hash Grid はコメントを受け付けていません