cs.CV」カテゴリーアーカイブ

LSMS: Language-guided Scale-aware MedSegmentor for Medical Image Referring Segmentation

要約 従来の医療画像セグメンテーション手法は、医師が診断や治療のために特定の病変 … 続きを読む

カテゴリー: cs.CV, I.4.6 | LSMS: Language-guided Scale-aware MedSegmentor for Medical Image Referring Segmentation はコメントを受け付けていません

Efficient Camera Exposure Control for Visual Odometry via Deep Reinforcement Learning

要約 ビジュアル オドメトリ (VO) システムの安定性は、特に照明の変化が大き … 続きを読む

カテゴリー: cs.CV, cs.RO | Efficient Camera Exposure Control for Visual Odometry via Deep Reinforcement Learning はコメントを受け付けていません

RoadRunner — Learning Traversability Estimation for Autonomous Off-road Driving

要約 オフロード環境での高速自律ナビゲーションでは、ロボットがオンボードセンシン … 続きを読む

カテゴリー: cs.CV, cs.RO | RoadRunner — Learning Traversability Estimation for Autonomous Off-road Driving はコメントを受け付けていません

Weakly-Supervised 3D Visual Grounding based on Visual Linguistic Alignment

要約 3D 点群内のターゲット オブジェクトまたは領域に自然言語クエリを基礎付け … 続きを読む

カテゴリー: cs.CL, cs.CV | Weakly-Supervised 3D Visual Grounding based on Visual Linguistic Alignment はコメントを受け付けていません

Does CLIP Bind Concepts? Probing Compositionality in Large Image Models

要約 テキストと画像を組み合わせた大規模なニューラル ネットワーク モデルは、近 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Does CLIP Bind Concepts? Probing Compositionality in Large Image Models はコメントを受け付けていません

Many-Worlds Inverse Rendering

要約 物理ベースのインバース レンダラ内でサーフェスを最適化する場合、不連続な可 … 続きを読む

カテゴリー: cs.CV, cs.GR | Many-Worlds Inverse Rendering はコメントを受け付けていません

RenDetNet: Weakly-supervised Shadow Detection with Shadow Caster Verification

要約 既存の影検出モデルは、暗い画像領域を影から区別するのに苦労しています。 こ … 続きを読む

カテゴリー: cs.CV, cs.GR | RenDetNet: Weakly-supervised Shadow Detection with Shadow Caster Verification はコメントを受け付けていません

GMM-IKRS: Gaussian Mixture Models for Interpretable Keypoint Refinement and Scoring

要約 画像内のキーポイントの抽出は、位置特定から 3D 再構成に至るまで、多くの … 続きを読む

カテゴリー: cs.CV | GMM-IKRS: Gaussian Mixture Models for Interpretable Keypoint Refinement and Scoring はコメントを受け付けていません

Look, Compare, Decide: Alleviating Hallucination in Large Vision-Language Models via Multi-View Multi-Path Reasoning

要約 最近、Large Vision-Language Model (LVLM) … 続きを読む

カテゴリー: cs.AI, cs.CV | Look, Compare, Decide: Alleviating Hallucination in Large Vision-Language Models via Multi-View Multi-Path Reasoning はコメントを受け付けていません

Self-supervised Anomaly Detection Pretraining Enhances Long-tail ECG Diagnosis

要約 現在のコンピュータ支援 ECG 診断システムは、ECG データセットの不均 … 続きを読む

カテゴリー: cs.CV | Self-supervised Anomaly Detection Pretraining Enhances Long-tail ECG Diagnosis はコメントを受け付けていません