cs.CV」カテゴリーアーカイブ

UFO: Enhancing Diffusion-Based Video Generation with a Uniform Frame Organizer

要約 最近、拡散ベースのビデオ生成モデルが大きな成功を収めています。 ただし、既 … 続きを読む

カテゴリー: cs.AI, cs.CV | UFO: Enhancing Diffusion-Based Video Generation with a Uniform Frame Organizer はコメントを受け付けていません

Distribution-Level Feature Distancing for Machine Unlearning: Towards a Better Trade-off Between Model Utility and Forgetting

要約 深層学習アプリケーションの爆発的な成長とプライバシーへの懸念の高まりに伴い … 続きを読む

カテゴリー: cs.AI, cs.CV | Distribution-Level Feature Distancing for Machine Unlearning: Towards a Better Trade-off Between Model Utility and Forgetting はコメントを受け付けていません

Hyperspectral Imaging-Based Perception in Autonomous Driving Scenarios: Benchmarking Baseline Semantic Segmentation Models

要約 ハイパースペクトル イメージング (HSI) は、リモート センシング、農 … 続きを読む

カテゴリー: cs.AI, cs.CV | Hyperspectral Imaging-Based Perception in Autonomous Driving Scenarios: Benchmarking Baseline Semantic Segmentation Models はコメントを受け付けていません

New keypoint-based approach for recognising British Sign Language (BSL) from sequences

要約 この論文では、連続的な手話シーケンス内の英国手話 (BSL) の単語を認識 … 続きを読む

カテゴリー: cs.AI, cs.CV | New keypoint-based approach for recognising British Sign Language (BSL) from sequences はコメントを受け付けていません

Video Seal: Open and Efficient Video Watermarking

要約 AI によって生成されたコンテンツと洗練されたビデオ編集ツールの急増により … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | Video Seal: Open and Efficient Video Watermarking はコメントを受け付けていません

Lyra: An Efficient and Speech-Centric Framework for Omni-Cognition

要約 マルチモーダル大規模言語モデル (MLLM) が進化するにつれて、より多用 … 続きを読む

カテゴリー: cs.CV, cs.MM | Lyra: An Efficient and Speech-Centric Framework for Omni-Cognition はコメントを受け付けていません

Vision Transformers for Efficient Indoor Pathloss Radio Map Prediction

要約 ビジョン トランスフォーマー (ViT) は、さまざまな画像ベースのタスク … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.NI | Vision Transformers for Efficient Indoor Pathloss Radio Map Prediction はコメントを受け付けていません

GEAL: Generalizable 3D Affordance Learning with Cross-Modal Consistency

要約 セマンティック キューから 3D オブジェクト上のアフォーダンス領域を特定 … 続きを読む

カテゴリー: cs.CV | GEAL: Generalizable 3D Affordance Learning with Cross-Modal Consistency はコメントを受け付けていません

Agent-based Video Trimming

要約 情報へのアクセスが容易になるにつれて、ユーザーが作成したビデオの長さは増加 … 続きを読む

カテゴリー: cs.CV | Agent-based Video Trimming はコメントを受け付けていません

Efficient and Comprehensive Feature Extraction in Large Vision-Language Model for Clinical Pathology Analysis

要約 病理学的診断は、疾患の特徴を決定し、治療を導き、予後を評価するために不可欠 … 続きを読む

カテゴリー: cs.AI, cs.CV | Efficient and Comprehensive Feature Extraction in Large Vision-Language Model for Clinical Pathology Analysis はコメントを受け付けていません