cs.CV」カテゴリーアーカイブ

JPEG Inspired Deep Learning

要約 従来、JPEG 圧縮などの非可逆画像圧縮はディープ ニューラル ネットワー … 続きを読む

カテゴリー: cs.CV | JPEG Inspired Deep Learning はコメントを受け付けていません

Comprehensive Performance Evaluation of YOLO11, YOLOv10, YOLOv9 and YOLOv8 on Detecting and Counting Fruitlet in Complex Orchard Environments

要約 この研究では、商業果樹園における緑色の果物の検出のために、YOLOv8、Y … 続きを読む

カテゴリー: cs.AI, cs.CV | Comprehensive Performance Evaluation of YOLO11, YOLOv10, YOLOv9 and YOLOv8 on Detecting and Counting Fruitlet in Complex Orchard Environments はコメントを受け付けていません

Towards Realistic UAV Vision-Language Navigation: Platform, Benchmark, and Methodology

要約 視覚言語ナビゲーション (VLN) として知られる、言語指示と視覚情報に基 … 続きを読む

カテゴリー: cs.CV, cs.RO | Towards Realistic UAV Vision-Language Navigation: Platform, Benchmark, and Methodology はコメントを受け付けていません

LaMP: Language-Motion Pretraining for Motion Generation, Retrieval, and Captioning

要約 言語は人間の動作の領域において重要な役割を果たします。 既存の方法は、モー … 続きを読む

カテゴリー: cs.CV | LaMP: Language-Motion Pretraining for Motion Generation, Retrieval, and Captioning はコメントを受け付けていません

Topologically Faithful Multi-class Segmentation in Medical Images

要約 医用画像セグメンテーションにおけるトポロジカルな精度は、ネットワーク解析や … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Topologically Faithful Multi-class Segmentation in Medical Images はコメントを受け付けていません

Continual Learning: Less Forgetting, More OOD Generalization via Adaptive Contrastive Replay

要約 機械学習モデルは、新しいクラスを学習するときに、以前に学習した知識を壊滅的 … 続きを読む

カテゴリー: cs.CV, cs.LG | Continual Learning: Less Forgetting, More OOD Generalization via Adaptive Contrastive Replay はコメントを受け付けていません

VHELM: A Holistic Evaluation of Vision Language Models

要約 視覚言語モデル (VLM) を評価するための現在のベンチマークは、多くの場 … 続きを読む

カテゴリー: cs.AI, cs.CV | VHELM: A Holistic Evaluation of Vision Language Models はコメントを受け付けていません

Personalized Visual Instruction Tuning

要約 マルチモーダル大規模言語モデル (MLLM) の最近の進歩は、顕著な進歩を … 続きを読む

カテゴリー: cs.CV | Personalized Visual Instruction Tuning はコメントを受け付けていません

Thing2Reality: Transforming 2D Content into Conditioned Multiviews and 3D Gaussian Objects for XR Communication

要約 リモートコミュニケーション中、参加者は相互理解を高めるために、製品デザイン … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.HC | Thing2Reality: Transforming 2D Content into Conditioned Multiviews and 3D Gaussian Objects for XR Communication はコメントを受け付けていません

EvolveDirector: Approaching Advanced Text-to-Image Generation with Large Vision-Language Models

要約 生成モデルの最近の進歩により、素晴らしいコンテンツを生成する際の顕著な機能 … 続きを読む

カテゴリー: cs.CV | EvolveDirector: Approaching Advanced Text-to-Image Generation with Large Vision-Language Models はコメントを受け付けていません