-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
JPEG Inspired Deep Learning
要約 従来、JPEG 圧縮などの非可逆画像圧縮はディープ ニューラル ネットワー … 続きを読む
カテゴリー: cs.CV
JPEG Inspired Deep Learning はコメントを受け付けていません
Comprehensive Performance Evaluation of YOLO11, YOLOv10, YOLOv9 and YOLOv8 on Detecting and Counting Fruitlet in Complex Orchard Environments
要約 この研究では、商業果樹園における緑色の果物の検出のために、YOLOv8、Y … 続きを読む
Towards Realistic UAV Vision-Language Navigation: Platform, Benchmark, and Methodology
要約 視覚言語ナビゲーション (VLN) として知られる、言語指示と視覚情報に基 … 続きを読む
LaMP: Language-Motion Pretraining for Motion Generation, Retrieval, and Captioning
要約 言語は人間の動作の領域において重要な役割を果たします。 既存の方法は、モー … 続きを読む
カテゴリー: cs.CV
LaMP: Language-Motion Pretraining for Motion Generation, Retrieval, and Captioning はコメントを受け付けていません
Topologically Faithful Multi-class Segmentation in Medical Images
要約 医用画像セグメンテーションにおけるトポロジカルな精度は、ネットワーク解析や … 続きを読む
Continual Learning: Less Forgetting, More OOD Generalization via Adaptive Contrastive Replay
要約 機械学習モデルは、新しいクラスを学習するときに、以前に学習した知識を壊滅的 … 続きを読む
VHELM: A Holistic Evaluation of Vision Language Models
要約 視覚言語モデル (VLM) を評価するための現在のベンチマークは、多くの場 … 続きを読む
Personalized Visual Instruction Tuning
要約 マルチモーダル大規模言語モデル (MLLM) の最近の進歩は、顕著な進歩を … 続きを読む
カテゴリー: cs.CV
Personalized Visual Instruction Tuning はコメントを受け付けていません
Thing2Reality: Transforming 2D Content into Conditioned Multiviews and 3D Gaussian Objects for XR Communication
要約 リモートコミュニケーション中、参加者は相互理解を高めるために、製品デザイン … 続きを読む
EvolveDirector: Approaching Advanced Text-to-Image Generation with Large Vision-Language Models
要約 生成モデルの最近の進歩により、素晴らしいコンテンツを生成する際の顕著な機能 … 続きを読む
カテゴリー: cs.CV
EvolveDirector: Approaching Advanced Text-to-Image Generation with Large Vision-Language Models はコメントを受け付けていません