月別アーカイブ: 2025年1月

VCEval: Rethinking What is a Good Educational Video and How to Automatically Evaluate It

要約 オンライン コースにより、教育へのアクセスの障壁は大幅に低くなりましたが、 … 続きを読む

カテゴリー: cs.CV, cs.MM | VCEval: Rethinking What is a Good Educational Video and How to Automatically Evaluate It はコメントを受け付けていません

Dr. Tongue: Sign-Oriented Multi-label Detection for Remote Tongue Diagnosis

要約 舌診断は西洋医学および伝統的中国医学において重要なツールであり、舌の特性を … 続きを読む

カテゴリー: cs.CV, eess.IV | Dr. Tongue: Sign-Oriented Multi-label Detection for Remote Tongue Diagnosis はコメントを受け付けていません

Reviewing Intelligent Cinematography: AI research for camera-based video production

要約 この論文は、エンターテインメント目的での実際のカメラ コンテンツ取得のコン … 続きを読む

カテゴリー: cs.CV, cs.MM | Reviewing Intelligent Cinematography: AI research for camera-based video production はコメントを受け付けていません

Through-The-Mask: Mask-based Motion Trajectories for Image-to-Video Generation

要約 ここでは、テキストによる説明に基づいて静止画像をリアルなビデオ シーケンス … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Through-The-Mask: Mask-based Motion Trajectories for Image-to-Video Generation はコメントを受け付けていません

Scale-wise Bidirectional Alignment Network for Referring Remote Sensing Image Segmentation

要約 リモート センシング画像セグメンテーション (RRSIS) を参照する目的 … 続きを読む

カテゴリー: cs.CV | Scale-wise Bidirectional Alignment Network for Referring Remote Sensing Image Segmentation はコメントを受け付けていません

AIF-SFDA: Autonomous Information Filter-driven Source-Free Domain Adaptation for Medical Image Segmentation

要約 ドメイン不変情報 (DII) からドメインバリアント情報 (DVI) を分 … 続きを読む

カテゴリー: cs.CV | AIF-SFDA: Autonomous Information Filter-driven Source-Free Domain Adaptation for Medical Image Segmentation はコメントを受け付けていません

TreeLearn: A deep learning method for segmenting individual trees from ground-based LiDAR forest point clouds

要約 レーザースキャンされた森林の点群により、森林管理のための貴重な情報を抽出す … 続きを読む

カテゴリー: cs.CV | TreeLearn: A deep learning method for segmenting individual trees from ground-based LiDAR forest point clouds はコメントを受け付けていません

Restore-RWKV: Efficient and Effective Medical Image Restoration with RWKV

要約 トランスフォーマーは医用画像の復元に革命をもたらしましたが、二次関数の複雑 … 続きを読む

カテゴリー: cs.CV, eess.IV | Restore-RWKV: Efficient and Effective Medical Image Restoration with RWKV はコメントを受け付けていません

Reconstruction vs. Generation: Taming Optimization Dilemma in Latent Diffusion Models

要約 Transformer アーキテクチャを備えた潜在拡散モデルは、高忠実度の … 続きを読む

カテゴリー: cs.CV, cs.LG | Reconstruction vs. Generation: Taming Optimization Dilemma in Latent Diffusion Models はコメントを受け付けていません

A Novel Structure-Agnostic Multi-Objective Approach for Weight-Sharing Compression in Deep Neural Networks

要約 ディープ ニューラル ネットワークは、トレーニング後に数百万、数十億の重み … 続きを読む

カテゴリー: cs.CV, cs.NE | A Novel Structure-Agnostic Multi-Objective Approach for Weight-Sharing Compression in Deep Neural Networks はコメントを受け付けていません