cs.CV」カテゴリーアーカイブ

EVQAScore: Efficient Video Question Answering Data Evaluation

要約 ビデオの質問応答 (QA) は、ビデオを理解する上で中心的なタスクです。 … 続きを読む

カテゴリー: cs.CL, cs.CV | EVQAScore: Efficient Video Question Answering Data Evaluation はコメントを受け付けていません

ENAT: Rethinking Spatial-temporal Interactions in Token-based Image Synthesis

要約 最近、トークンベースの生成が画像合成において有効であることが実証されました … 続きを読む

カテゴリー: cs.AI, cs.CV | ENAT: Rethinking Spatial-temporal Interactions in Token-based Image Synthesis はコメントを受け付けていません

Robust Fine-tuning of Zero-shot Models via Variance Reduction

要約 CLIP のようなゼロショット モデルを微調整する場合、微調整されたモデル … 続きを読む

カテゴリー: cs.CV | Robust Fine-tuning of Zero-shot Models via Variance Reduction はコメントを受け付けていません

A Hyperspectral Imaging Dataset and Methodology for Intraoperative Pixel-Wise Classification of Metastatic Colon Cancer in the Liver

要約 ハイパースペクトル イメージング (HSI) は、計算病理学の分野を変革す … 続きを読む

カテゴリー: 68T07, 68T10, 68U10, cs.CV, eess.IV, I.4.6 | A Hyperspectral Imaging Dataset and Methodology for Intraoperative Pixel-Wise Classification of Metastatic Colon Cancer in the Liver はコメントを受け付けていません

MapSAM: Adapting Segment Anything Model for Automated Feature Detection in Historical Maps

要約 歴史地図の自動特徴検出により、過去の地理空間の再構築が大幅に加速されます。 … 続きを読む

カテゴリー: cs.CV | MapSAM: Adapting Segment Anything Model for Automated Feature Detection in Historical Maps はコメントを受け付けていません

StoryAgent: Customized Storytelling Video Generation via Multi-Agent Collaboration

要約 AI 生成コンテンツ (AIGC) の出現により、従来のプロセスを合理化す … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MA | StoryAgent: Customized Storytelling Video Generation via Multi-Agent Collaboration はコメントを受け付けていません

IntegratedPIFu: Integrated Pixel Aligned Implicit Function for Single-view Human Reconstruction

要約 私たちは、PIFuHD によって設定された基盤上に構築される新しいピクセル … 続きを読む

カテゴリー: cs.AI, cs.CV | IntegratedPIFu: Integrated Pixel Aligned Implicit Function for Single-view Human Reconstruction はコメントを受け付けていません

A Hierarchical Compression Technique for 3D Gaussian Splatting Compression

要約 3D ガウス スプラッティング (GS) は、新しいビュー合成において優れ … 続きを読む

カテゴリー: cs.CV, cs.MM | A Hierarchical Compression Technique for 3D Gaussian Splatting Compression はコメントを受け付けていません

Unified Lexical Representation for Interpretable Visual-Language Alignment

要約 Visual-Language Alignment (VLA) は、CLI … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Unified Lexical Representation for Interpretable Visual-Language Alignment はコメントを受け付けていません

SIESEF-FusionNet: Spatial Inter-correlation Enhancement and Spatially-Embedded Feature Fusion Network for LiDAR Point Cloud Semantic Segmentation

要約 点群セマンティック セグメンテーションにおけるさまざまなセマンティック ク … 続きを読む

カテゴリー: cs.CV | SIESEF-FusionNet: Spatial Inter-correlation Enhancement and Spatially-Embedded Feature Fusion Network for LiDAR Point Cloud Semantic Segmentation はコメントを受け付けていません