「cs.CV」カテゴリーアーカイブ

EVQAScore: Efficient Video Question Answering Data Evaluation

投稿日: 2024年11月12日作成者: jarxiv

要約ビデオの質問応答 (QA) は、ビデオを理解する上で中心的なタスクです。 … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

ENAT: Rethinking Spatial-temporal Interactions in Token-based Image Synthesis

投稿日: 2024年11月12日作成者: jarxiv

要約最近、トークンベースの生成が画像合成において有効であることが実証されました … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Robust Fine-tuning of Zero-shot Models via Variance Reduction

投稿日: 2024年11月12日作成者: jarxiv

要約 CLIP のようなゼロショットモデルを微調整する場合、微調整されたモデル … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

A Hyperspectral Imaging Dataset and Methodology for Intraoperative Pixel-Wise Classification of Metastatic Colon Cancer in the Liver

投稿日: 2024年11月12日作成者: jarxiv

要約ハイパースペクトルイメージング (HSI) は、計算病理学の分野を変革す … 続きを読む →

カテゴリー: 68T07, 68T10, 68U10, cs.CV, eess.IV, I.4.6 | コメントを受け付けていません

MapSAM: Adapting Segment Anything Model for Automated Feature Detection in Historical Maps

投稿日: 2024年11月12日作成者: jarxiv

要約歴史地図の自動特徴検出により、過去の地理空間の再構築が大幅に加速されます。 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

StoryAgent: Customized Storytelling Video Generation via Multi-Agent Collaboration

投稿日: 2024年11月12日作成者: jarxiv

要約 AI 生成コンテンツ (AIGC) の出現により、従来のプロセスを合理化す … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MA | コメントを受け付けていません

IntegratedPIFu: Integrated Pixel Aligned Implicit Function for Single-view Human Reconstruction

投稿日: 2024年11月12日作成者: jarxiv

要約私たちは、PIFuHD によって設定された基盤上に構築される新しいピクセル … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

A Hierarchical Compression Technique for 3D Gaussian Splatting Compression

投稿日: 2024年11月12日作成者: jarxiv

要約 3D ガウススプラッティング (GS) は、新しいビュー合成において優れ … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

Unified Lexical Representation for Interpretable Visual-Language Alignment

投稿日: 2024年11月12日作成者: jarxiv

要約 Visual-Language Alignment (VLA) は、CLI … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

SIESEF-FusionNet: Spatial Inter-correlation Enhancement and Spatially-Embedded Feature Fusion Network for LiDAR Point Cloud Semantic Segmentation

投稿日: 2024年11月12日作成者: jarxiv

要約点群セマンティックセグメンテーションにおけるさまざまなセマンティックク … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

EVQAScore: Efficient Video Question Answering Data Evaluation

ENAT: Rethinking Spatial-temporal Interactions in Token-based Image Synthesis

Robust Fine-tuning of Zero-shot Models via Variance Reduction

A Hyperspectral Imaging Dataset and Methodology for Intraoperative Pixel-Wise Classification of Metastatic Colon Cancer in the Liver

MapSAM: Adapting Segment Anything Model for Automated Feature Detection in Historical Maps

StoryAgent: Customized Storytelling Video Generation via Multi-Agent Collaboration

IntegratedPIFu: Integrated Pixel Aligned Implicit Function for Single-view Human Reconstruction

A Hierarchical Compression Technique for 3D Gaussian Splatting Compression

Unified Lexical Representation for Interpretable Visual-Language Alignment

SIESEF-FusionNet: Spatial Inter-correlation Enhancement and Spatially-Embedded Feature Fusion Network for LiDAR Point Cloud Semantic Segmentation

最近の投稿

最近のコメント

アーカイブ

カテゴリー