cs.AI」カテゴリーアーカイブ

Revisiting the Role of Language Priors in Vision-Language Models

要約 視覚言語モデル (VLM) が影響力を持つ理由の 1 つは、微調整を行わず … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Revisiting the Role of Language Priors in Vision-Language Models はコメントを受け付けていません

Transforming gradient-based techniques into interpretable methods

要約 xAI 技術による畳み込みニューラル ネットワーク (CNN) の説明では … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Transforming gradient-based techniques into interpretable methods はコメントを受け付けていません

Xmodel-VLM: A Simple Baseline for Multimodal Vision Language Model

要約 最先端のマルチモーダル ビジョン言語モデルである Xmodel-VLM を … 続きを読む

カテゴリー: cs.AI, cs.CV | Xmodel-VLM: A Simple Baseline for Multimodal Vision Language Model はコメントを受け付けていません

Dance Any Beat: Blending Beats with Visuals in Dance Video Generation

要約 音楽からダンスを生成するというタスクは重要ですが、主に関節シーケンスを生成 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM, cs.SD, eess.AS | Dance Any Beat: Blending Beats with Visuals in Dance Video Generation はコメントを受け付けていません

Sensitivity Decouple Learning for Image Compression Artifacts Reduction

要約 深層学習技術の恩恵により、最近の研究では画像圧縮アーティファクトの削減にお … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | Sensitivity Decouple Learning for Image Compression Artifacts Reduction はコメントを受け付けていません

ReconBoost: Boosting Can Achieve Modality Reconcilement

要約 この論文では、ユニモーダル機能の活用とクロスモーダル相互作用の探索の間の調 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | ReconBoost: Boosting Can Achieve Modality Reconcilement はコメントを受け付けていません

Content-Based Image Retrieval for Multi-Class Volumetric Radiology Images: A Benchmark Study

要約 コンテンツベースの画像検索 (CBIR) は自然画像検索において広く研究さ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.IR | Content-Based Image Retrieval for Multi-Class Volumetric Radiology Images: A Benchmark Study はコメントを受け付けていません

Vision-Based Neurosurgical Guidance: Unsupervised Localization and Camera-Pose Prediction

要約 内視鏡処置中に自分の位置を特定することは、識別可能なテクスチャやランドマー … 続きを読む

カテゴリー: cs.AI, cs.CV | Vision-Based Neurosurgical Guidance: Unsupervised Localization and Camera-Pose Prediction はコメントを受け付けていません

Fourier Boundary Features Network with Wider Catchers for Glass Segmentation

要約 ガラスは現実世界と反射の間の境界を大幅に曖昧にします。 特殊な透過率と反射 … 続きを読む

カテゴリー: cs.AI, cs.CV | Fourier Boundary Features Network with Wider Catchers for Glass Segmentation はコメントを受け付けていません

A Unified Sequence Parallelism Approach for Long Context Generative AI

要約 入力テンソルのシーケンス次元を複数の計算デバイスに分割するシーケンス並列処 … 続きを読む

カテゴリー: cs.AI, cs.LG | A Unified Sequence Parallelism Approach for Long Context Generative AI はコメントを受け付けていません