月別アーカイブ: 2025年4月

Efficient Contrastive Decoding with Probabilistic Hallucination Detection – Mitigating Hallucinations in Large Vision Language Models –

要約 大規模なビジョン言語モデル(LVLMS)の最近の進歩にもかかわらず、これら … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Efficient Contrastive Decoding with Probabilistic Hallucination Detection – Mitigating Hallucinations in Large Vision Language Models – はコメントを受け付けていません

OmniDrive: A Holistic Vision-Language Dataset for Autonomous Driving with Counterfactual Reasoning

要約 ビジョン言語モデル(VLM)の進歩により、強力な推論能力を活用するための自 … 続きを読む

カテゴリー: cs.CV | OmniDrive: A Holistic Vision-Language Dataset for Autonomous Driving with Counterfactual Reasoning はコメントを受け付けていません

Document Parsing Unveiled: Techniques, Challenges, and Prospects for Structured Information Extraction

要約 ドキュメント解析は、契約、学術論文、請求書などの非構造化および半構造化され … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | Document Parsing Unveiled: Techniques, Challenges, and Prospects for Structured Information Extraction はコメントを受け付けていません

FocusedAD: Character-centric Movie Audio Description

要約 映画オーディオの説明(AD)は、対話のないセグメント中に視覚的なコンテンツ … 続きを読む

カテゴリー: cs.CV, I.2.10 | FocusedAD: Character-centric Movie Audio Description はコメントを受け付けていません

StructRe: Rewriting for Structured Shape Modeling

要約 人工の3D形状は、部品と階層で自然に編成されています。 このような構造は、 … 続きを読む

カテゴリー: cs.CV | StructRe: Rewriting for Structured Shape Modeling はコメントを受け付けていません

Cross-Modal Mapping: Mitigating the Modality Gap for Few-Shot Image Classification

要約 少ないショット画像分類は、コンピュータービジョンの分野、特にデータスカース … 続きを読む

カテゴリー: cs.CV | Cross-Modal Mapping: Mitigating the Modality Gap for Few-Shot Image Classification はコメントを受け付けていません

Exploring Self-supervised Skeleton-based Action Recognition in Occluded Environments

要約 アクション認識を自律的なロボットシステムに統合するには、人の閉塞などの課題 … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.RO, eess.IV | Exploring Self-supervised Skeleton-based Action Recognition in Occluded Environments はコメントを受け付けていません

OmniDrive: A Holistic Vision-Language Dataset for Autonomous Driving with Counterfactual Reasoning

要約 ビジョン言語モデル(VLM)の進歩により、強力な推論能力を活用するための自 … 続きを読む

カテゴリー: cs.CV | OmniDrive: A Holistic Vision-Language Dataset for Autonomous Driving with Counterfactual Reasoning はコメントを受け付けていません

Strategic Client Selection to Address Non-IIDness in HAPS-enabled FL Networks

要約 高高度プラットフォームステーション(HAPS)によってサポートされている非 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.NI | Strategic Client Selection to Address Non-IIDness in HAPS-enabled FL Networks はコメントを受け付けていません

Deep Anatomical Federated Network (Dafne): An open client-server framework for the continuous, collaborative improvement of deep learning-based medical image segmentation

要約 目的:Dafne(深い解剖学的フェデレーションネットワーク)を提示して評価 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Deep Anatomical Federated Network (Dafne): An open client-server framework for the continuous, collaborative improvement of deep learning-based medical image segmentation はコメントを受け付けていません