-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年1月
MLVU: Benchmarking Multi-task Long Video Understanding
要約 Long Video Understanding (LVU) パフォーマン … 続きを読む
Prompt-Based Segmentation at Multiple Resolutions and Lighting Conditions using Segment Anything Model 2
要約 このペーパーでは、ゼロ ショットのプロンプトベースのセグメント エニシング … 続きを読む
カテゴリー: cs.CV
Prompt-Based Segmentation at Multiple Resolutions and Lighting Conditions using Segment Anything Model 2 はコメントを受け付けていません
Using a CNN Model to Assess Paintings’ Creativity
要約 芸術的創造性の評価は研究者にとって長年の課題であり、従来の方法では時間がか … 続きを読む
Adaptive Prompt Tuning: Vision Guided Prompt Tuning with Cross-Attention for Fine-Grained Few-Shot Learning
要約 コンピュータ ビジョンにおける少数ショットのきめ細かい分類は、限られたデー … 続きを読む
VAPO: Visibility-Aware Keypoint Localization for Efficient 6DoF Object Pose Estimation
要約 2D 画像内の事前定義された 3D キーポイントの位置を特定することは、6 … 続きを読む
カテゴリー: cs.CV
VAPO: Visibility-Aware Keypoint Localization for Efficient 6DoF Object Pose Estimation はコメントを受け付けていません
Refining Skewed Perceptions in Vision-Language Models through Visual Representations
要約 CLIP などの大規模ビジョン言語モデル (VLM) は基盤となり、さまざ … 続きを読む
The Unmet Promise of Synthetic Training Images: Using Retrieved Real Images Performs Better
要約 テキストから画像への生成モデルを使用すると、制御可能な方法で無制限の量の画 … 続きを読む
カテゴリー: cs.CV
The Unmet Promise of Synthetic Training Images: Using Retrieved Real Images Performs Better はコメントを受け付けていません
Region-Guided Attack on the Segment Anything Model (SAM)
要約 Segment Anything Model (SAM) は画像セグメンテ … 続きを読む
Hear the Scene: Audio-Enhanced Text Spotting
要約 シーン テキスト スポッティングの最近の進歩は、正確な位置の注釈に大きく依 … 続きを読む
カテゴリー: cs.CV
Hear the Scene: Audio-Enhanced Text Spotting はコメントを受け付けていません
SpecDETR: A Transformer-based Hyperspectral Point Object Detection Network
要約 ハイパースペクトル ターゲット検出 (HTD) は、ハイパースペクトル画像 … 続きを読む
カテゴリー: cs.CV
SpecDETR: A Transformer-based Hyperspectral Point Object Detection Network はコメントを受け付けていません