月別アーカイブ: 2024年8月

Model Merging in LLMs, MLLMs, and Beyond: Methods, Theories, Applications and Opportunities

要約 モデルのマージは、機械学習コミュニティにおける効率的なエンパワーメント手法 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Model Merging in LLMs, MLLMs, and Beyond: Methods, Theories, Applications and Opportunities はコメントを受け付けていません

Data Science for Geographic Information Systems

要約 データ サイエンスを地理情報システム (GIS) に統合することで、これら … 続きを読む

カテゴリー: cs.CV, eess.IV, I.2.10, physics.geo-ph | Data Science for Geographic Information Systems はコメントを受け付けていません

G$^2$V$^2$former: Graph Guided Video Vision Transformer for Face Anti-Spoofing

要約 なりすましの顔を含むビデオでは、測光異常または動的異常のいずれか、あるいは … 続きを読む

カテゴリー: cs.CV | G$^2$V$^2$former: Graph Guided Video Vision Transformer for Face Anti-Spoofing はコメントを受け付けていません

Robust Curve Detection in Volumetric Medical Imaging via Attraction Field

要約 身体部分の形状を理解することは、正確な医療診断にとって非常に重要です。 曲 … 続きを読む

カテゴリー: cs.CV | Robust Curve Detection in Volumetric Medical Imaging via Attraction Field はコメントを受け付けていません

A Spitting Image: Modular Superpixel Tokenization in Vision Transformers

要約 Vision Transformer (ViT) アーキテクチャは伝統的に … 続きを読む

カテゴリー: 68T45, cs.AI, cs.CV, cs.LG, I.2.10 | A Spitting Image: Modular Superpixel Tokenization in Vision Transformers はコメントを受け付けていません

NIGHT — Non-Line-of-Sight Imaging from Indirect Time of Flight Data

要約 カメラの視線外の物体の取得は、非常に興味深いものですが、非常に挑戦的な研究 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | NIGHT — Non-Line-of-Sight Imaging from Indirect Time of Flight Data はコメントを受け付けていません

RSD-DOG : A New Image Descriptor based on Second Order Derivatives

要約 この論文では、二次画像統計/導関数に基づいた新しい強力な画像パッチ記述子を … 続きを読む

カテゴリー: cs.CV | RSD-DOG : A New Image Descriptor based on Second Order Derivatives はコメントを受け付けていません

Idea2Img: Iterative Self-Refinement with GPT-4V(ision) for Automatic Image Design and Generation

要約 GPT-4V(ision)による画像設計・自動生成を用いたマルチモーダルな … 続きを読む

カテゴリー: cs.CV | Idea2Img: Iterative Self-Refinement with GPT-4V(ision) for Automatic Image Design and Generation はコメントを受け付けていません

Detecting Near-Duplicate Face Images

要約 フォトメトリックおよび幾何学的な変換を繰り返し適用すると、元のイメージの知 … 続きを読む

カテゴリー: cs.CV | Detecting Near-Duplicate Face Images はコメントを受け付けていません

End-to-end Semantic-centric Video-based Multimodal Affective Computing

要約 汎用人工知能 (AGI) への道において、人間の愛情を理解することは、機械 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | End-to-end Semantic-centric Video-based Multimodal Affective Computing はコメントを受け付けていません