「cs.CV」カテゴリーアーカイブ

LSMS: Language-guided Scale-aware MedSegmentor for Medical Image Referring Segmentation

投稿日: 2024年9月4日作成者: jarxiv

要約従来の医療画像セグメンテーション手法は、医師が診断や治療のために特定の病変 … 続きを読む →

カテゴリー: cs.CV, I.4.6 | コメントを受け付けていません

Efficient Camera Exposure Control for Visual Odometry via Deep Reinforcement Learning

投稿日: 2024年9月2日作成者: jarxiv

要約ビジュアルオドメトリ (VO) システムの安定性は、特に照明の変化が大き … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

RoadRunner — Learning Traversability Estimation for Autonomous Off-road Driving

投稿日: 2024年9月2日作成者: jarxiv

要約オフロード環境での高速自律ナビゲーションでは、ロボットがオンボードセンシン … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Weakly-Supervised 3D Visual Grounding based on Visual Linguistic Alignment

投稿日: 2024年9月2日作成者: jarxiv

要約 3D 点群内のターゲットオブジェクトまたは領域に自然言語クエリを基礎付け … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Does CLIP Bind Concepts? Probing Compositionality in Large Image Models

投稿日: 2024年9月2日作成者: jarxiv

要約テキストと画像を組み合わせた大規模なニューラルネットワークモデルは、近 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

Many-Worlds Inverse Rendering

投稿日: 2024年9月2日作成者: jarxiv

要約物理ベースのインバースレンダラ内でサーフェスを最適化する場合、不連続な可 … 続きを読む →

カテゴリー: cs.CV, cs.GR | コメントを受け付けていません

RenDetNet: Weakly-supervised Shadow Detection with Shadow Caster Verification

投稿日: 2024年9月2日作成者: jarxiv

要約既存の影検出モデルは、暗い画像領域を影から区別するのに苦労しています。こ … 続きを読む →

カテゴリー: cs.CV, cs.GR | コメントを受け付けていません

GMM-IKRS: Gaussian Mixture Models for Interpretable Keypoint Refinement and Scoring

投稿日: 2024年9月2日作成者: jarxiv

要約画像内のキーポイントの抽出は、位置特定から 3D 再構成に至るまで、多くの … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Look, Compare, Decide: Alleviating Hallucination in Large Vision-Language Models via Multi-View Multi-Path Reasoning

投稿日: 2024年9月2日作成者: jarxiv

要約最近、Large Vision-Language Model (LVLM) … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Self-supervised Anomaly Detection Pretraining Enhances Long-tail ECG Diagnosis

投稿日: 2024年9月2日作成者: jarxiv

要約現在のコンピュータ支援 ECG 診断システムは、ECG データセットの不均 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

LSMS: Language-guided Scale-aware MedSegmentor for Medical Image Referring Segmentation

Efficient Camera Exposure Control for Visual Odometry via Deep Reinforcement Learning

RoadRunner — Learning Traversability Estimation for Autonomous Off-road Driving

Weakly-Supervised 3D Visual Grounding based on Visual Linguistic Alignment

Does CLIP Bind Concepts? Probing Compositionality in Large Image Models

Many-Worlds Inverse Rendering

RenDetNet: Weakly-supervised Shadow Detection with Shadow Caster Verification

GMM-IKRS: Gaussian Mixture Models for Interpretable Keypoint Refinement and Scoring

Look, Compare, Decide: Alleviating Hallucination in Large Vision-Language Models via Multi-View Multi-Path Reasoning

Self-supervised Anomaly Detection Pretraining Enhances Long-tail ECG Diagnosis

最近の投稿

最近のコメント

アーカイブ

カテゴリー