-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年1月
Learning to Mask and Permute Visual Tokens for Vision Transformer Pre-Training
要約 自己監視型事前トレーニングの使用は、さまざまな視覚タスクのパフォーマンスを … 続きを読む
DocTTT: Test-Time Training for Handwritten Document Recognition Using Meta-Auxiliary Learning
要約 手書き文書認識 (HDR) は最近大幅に進歩しましたが、複雑な背景、多様な … 続きを読む
カテゴリー: cs.CV
DocTTT: Test-Time Training for Handwritten Document Recognition Using Meta-Auxiliary Learning はコメントを受け付けていません
PreciseCam: Precise Camera Control for Text-to-Image Generation
要約 芸術的な媒体としての画像は、アイデアや感情を伝えるために特定のカメラ アン … 続きを読む
Capsule Vision 2024 Challenge: Multi-Class Abnormality Classification for Video Capsule Endoscopy
要約 Capsule Vision 2024 チャレンジ: ビデオ カプセル内視 … 続きを読む
カテゴリー: cs.CV
Capsule Vision 2024 Challenge: Multi-Class Abnormality Classification for Video Capsule Endoscopy はコメントを受け付けていません
DynamicEarth: How Far are We from Open-Vocabulary Change Detection?
要約 進化する地球の土地被覆を監視するには、幅広いカテゴリーや状況にわたる変化を … 続きを読む
カテゴリー: cs.CV
DynamicEarth: How Far are We from Open-Vocabulary Change Detection? はコメントを受け付けていません
3D Object Manipulation in a Single Image using Generative Models
要約 画像内のオブジェクト操作は、オブジェクトのプレゼンテーションを編集するだけ … 続きを読む
カテゴリー: cs.CV
3D Object Manipulation in a Single Image using Generative Models はコメントを受け付けていません
Search3D: Hierarchical Open-Vocabulary 3D Segmentation
要約 オープンボキャブラリーの 3D セグメンテーションにより、自由形式のテキス … 続きを読む
カテゴリー: cs.CV
Search3D: Hierarchical Open-Vocabulary 3D Segmentation はコメントを受け付けていません
A Novel Tracking Framework for Devices in X-ray Leveraging Supplementary Cue-Driven Self-Supervised Features
要約 血管形成術によって閉塞した冠動脈の適切な血流を回復するには、ライブ透視また … 続きを読む
Pay Attention and Move Better: Harnessing Attention for Interactive Motion Generation and Training-free Editing
要約 この研究では、人間のモーション生成のインタラクティブな編集の問題を詳しく調 … 続きを読む
カテゴリー: cs.CV
Pay Attention and Move Better: Harnessing Attention for Interactive Motion Generation and Training-free Editing はコメントを受け付けていません
Boosting Diffusion Guidance via Learning Degradation-Aware Models for Blind Super Resolution
要約 最近、拡散ベースのブラインド超解像 (SR) 手法は、豊富な高周波ディテー … 続きを読む