「cs.CV」カテゴリーアーカイブ

UFO: Enhancing Diffusion-Based Video Generation with a Uniform Frame Organizer

投稿日: 2024年12月13日作成者: jarxiv

要約最近、拡散ベースのビデオ生成モデルが大きな成功を収めています。ただし、既 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Distribution-Level Feature Distancing for Machine Unlearning: Towards a Better Trade-off Between Model Utility and Forgetting

投稿日: 2024年12月13日作成者: jarxiv

要約深層学習アプリケーションの爆発的な成長とプライバシーへの懸念の高まりに伴い … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Hyperspectral Imaging-Based Perception in Autonomous Driving Scenarios: Benchmarking Baseline Semantic Segmentation Models

投稿日: 2024年12月13日作成者: jarxiv

要約ハイパースペクトルイメージング (HSI) は、リモートセンシング、農 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

New keypoint-based approach for recognising British Sign Language (BSL) from sequences

投稿日: 2024年12月13日作成者: jarxiv

要約この論文では、連続的な手話シーケンス内の英国手話 (BSL) の単語を認識 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Video Seal: Open and Efficient Video Watermarking

投稿日: 2024年12月13日作成者: jarxiv

要約 AI によって生成されたコンテンツと洗練されたビデオ編集ツールの急増により … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM | コメントを受け付けていません

Lyra: An Efficient and Speech-Centric Framework for Omni-Cognition

投稿日: 2024年12月13日作成者: jarxiv

要約マルチモーダル大規模言語モデル (MLLM) が進化するにつれて、より多用 … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

Vision Transformers for Efficient Indoor Pathloss Radio Map Prediction

投稿日: 2024年12月13日作成者: jarxiv

要約ビジョントランスフォーマー (ViT) は、さまざまな画像ベースのタスク … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.NI | コメントを受け付けていません

GEAL: Generalizable 3D Affordance Learning with Cross-Modal Consistency

投稿日: 2024年12月13日作成者: jarxiv

要約セマンティックキューから 3D オブジェクト上のアフォーダンス領域を特定 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Agent-based Video Trimming

投稿日: 2024年12月13日作成者: jarxiv

要約情報へのアクセスが容易になるにつれて、ユーザーが作成したビデオの長さは増加 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Efficient and Comprehensive Feature Extraction in Large Vision-Language Model for Clinical Pathology Analysis

投稿日: 2024年12月13日作成者: jarxiv

要約病理学的診断は、疾患の特徴を決定し、治療を導き、予後を評価するために不可欠 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

UFO: Enhancing Diffusion-Based Video Generation with a Uniform Frame Organizer

Distribution-Level Feature Distancing for Machine Unlearning: Towards a Better Trade-off Between Model Utility and Forgetting

Hyperspectral Imaging-Based Perception in Autonomous Driving Scenarios: Benchmarking Baseline Semantic Segmentation Models

New keypoint-based approach for recognising British Sign Language (BSL) from sequences

Video Seal: Open and Efficient Video Watermarking

Lyra: An Efficient and Speech-Centric Framework for Omni-Cognition

Vision Transformers for Efficient Indoor Pathloss Radio Map Prediction

GEAL: Generalizable 3D Affordance Learning with Cross-Modal Consistency

Agent-based Video Trimming

Efficient and Comprehensive Feature Extraction in Large Vision-Language Model for Clinical Pathology Analysis

最近の投稿

最近のコメント

アーカイブ

カテゴリー