投稿者「jarxiv」のアーカイブ

Collaborative Learning for Enhanced Unsupervised Domain Adaptation

要約 監視されていないドメイン適応(UDA)は、ラベル付けされたソースドメインで … 続きを読む

カテゴリー: cs.CV | Collaborative Learning for Enhanced Unsupervised Domain Adaptation はコメントを受け付けていません

Metric-Solver: Sliding Anchored Metric Depth Estimation from a Single Image

要約 さまざまなコンピュータービジョンアプリケーションでは、正確で一般化可能なメ … 続きを読む

カテゴリー: cs.CV | Metric-Solver: Sliding Anchored Metric Depth Estimation from a Single Image はコメントを受け付けていません

Logits DeConfusion with CLIP for Few-Shot Learning

要約 強力な視覚言語アライメント機能を備えたClipは、ゼロショットと少ないショ … 続きを読む

カテゴリー: cs.CV | Logits DeConfusion with CLIP for Few-Shot Learning はコメントを受け付けていません

A Diffusion-Based Framework for Terrain-Aware Remote Sensing Image Reconstruction

要約 リモートセンシング画像は、環境監視、農業管理、災害対応に不可欠です。 ただ … 続きを読む

カテゴリー: cs.CV, eess.IV | A Diffusion-Based Framework for Terrain-Aware Remote Sensing Image Reconstruction はコメントを受け付けていません

Remote sensing colour image semantic segmentation of trails created by large herbivorous Mammals

要約 生物多様性が危険にさらされている空間領域の検出は、生態系の保全と監視にとっ … 続きを読む

カテゴリー: cs.CV | Remote sensing colour image semantic segmentation of trails created by large herbivorous Mammals はコメントを受け付けていません

GST: Precise 3D Human Body from a Single Image with Gaussian Splatting Transformers

要約 モノクラー画像からの3Dヒトモデルの再構築は、パフォーマンス追跡、怪我防止 … 続きを読む

カテゴリー: cs.AI, cs.CV | GST: Precise 3D Human Body from a Single Image with Gaussian Splatting Transformers はコメントを受け付けていません

Anti-Aesthetics: Protecting Facial Privacy against Customized Text-to-Image Synthesis

要約 カスタマイズされた拡散モデルの台頭により、パーソナライズされた視覚コンテン … 続きを読む

カテゴリー: cs.CV | Anti-Aesthetics: Protecting Facial Privacy against Customized Text-to-Image Synthesis はコメントを受け付けていません

Weakly Semi-supervised Whole Slide Image Classification by Two-level Cross Consistency Supervision

要約 コンピューター支援全体のスライド画像(WSI)分類は、臨床病理学的診断の精 … 続きを読む

カテゴリー: cs.CV | Weakly Semi-supervised Whole Slide Image Classification by Two-level Cross Consistency Supervision はコメントを受け付けていません

Efficient Contrastive Decoding with Probabilistic Hallucination Detection – Mitigating Hallucinations in Large Vision Language Models –

要約 大規模なビジョン言語モデル(LVLMS)の最近の進歩にもかかわらず、これら … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Efficient Contrastive Decoding with Probabilistic Hallucination Detection – Mitigating Hallucinations in Large Vision Language Models – はコメントを受け付けていません

OmniDrive: A Holistic Vision-Language Dataset for Autonomous Driving with Counterfactual Reasoning

要約 ビジョン言語モデル(VLM)の進歩により、強力な推論能力を活用するための自 … 続きを読む

カテゴリー: cs.CV | OmniDrive: A Holistic Vision-Language Dataset for Autonomous Driving with Counterfactual Reasoning はコメントを受け付けていません