月別アーカイブ: 2024年4月

High-Fidelity Lake Extraction via Two-Stage Prompt Enhancement: Establishing a Novel Baseline and Benchmark

要約 リモート センシング画像から湖を抽出することは、湖の形状やデータ ノイズが … 続きを読む

カテゴリー: cs.CV | High-Fidelity Lake Extraction via Two-Stage Prompt Enhancement: Establishing a Novel Baseline and Benchmark はコメントを受け付けていません

Sketch Input Method Editor: A Comprehensive Dataset and Methodology for Systematic Input Recognition

要約 最近のタッチスクリーン デバイスの使用の急増により、フリーハンド スケッチ … 続きを読む

カテゴリー: cs.AI, cs.CV | Sketch Input Method Editor: A Comprehensive Dataset and Methodology for Systematic Input Recognition はコメントを受け付けていません

Break-for-Make: Modular Low-Rank Adaptations for Composable Content-Style Customization

要約 パーソナライズされた生成パラダイムにより、デザイナーは、いくつかの画像に対 … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.MM | Break-for-Make: Modular Low-Rank Adaptations for Composable Content-Style Customization はコメントを受け付けていません

C-TPT: Calibrated Test-Time Prompt Tuning for Vision-Language Models via Text Feature Dispersion

要約 深層学習では、ラベル付きデータを必要とせずにモデルを微調整する方法として、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | C-TPT: Calibrated Test-Time Prompt Tuning for Vision-Language Models via Text Feature Dispersion はコメントを受け付けていません

Multi-Channel Orthogonal Transform-Based Perceptron Layers for Efficient ResNets

要約 この論文では、畳み込みニューラル ネットワーク (CNN) の $3\ti … 続きを読む

カテゴリー: cs.CV, eess.IV, eess.SP | Multi-Channel Orthogonal Transform-Based Perceptron Layers for Efficient ResNets はコメントを受け付けていません

Modular Blind Video Quality Assessment

要約 ブラインド ビデオ品質評価 (BVQA) は、幅広いビデオベースのプラット … 続きを読む

カテゴリー: cs.CV, eess.IV | Modular Blind Video Quality Assessment はコメントを受け付けていません

Language-driven Object Fusion into Neural Radiance Fields with Pose-Conditioned Dataset Updates

要約 ニューラル放射輝度フィールドは、ニューラル シーン表現とボリューム レンダ … 続きを読む

カテゴリー: cs.CV | Language-driven Object Fusion into Neural Radiance Fields with Pose-Conditioned Dataset Updates はコメントを受け付けていません

A New Benchmark and Model for Challenging Image Manipulation Detection

要約 マルチメディア データの改ざんを検出する機能は、デジタル フォレンジックに … 続きを読む

カテゴリー: cs.CV | A New Benchmark and Model for Challenging Image Manipulation Detection はコメントを受け付けていません

DriveVLM: The Convergence of Autonomous Driving and Large Vision-Language Models

要約 都市環境における自動運転の主なハードルは、困難な道路状況や繊細な人間の行動 … 続きを読む

カテゴリー: cs.CV | DriveVLM: The Convergence of Autonomous Driving and Large Vision-Language Models はコメントを受け付けていません

Object Recognition as Next Token Prediction

要約 次のトークンの予測としてオブジェクト認識をポーズするアプローチを紹介します … 続きを読む

カテゴリー: cs.CV | Object Recognition as Next Token Prediction はコメントを受け付けていません