cs.CV」カテゴリーアーカイブ

LiDAR-based End-to-end Temporal Perception for Vehicle-Infrastructure Cooperation

要約 時間的知覚、つまり時間の経過とともに物体を検出して追跡する能力は、自動運転 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | LiDAR-based End-to-end Temporal Perception for Vehicle-Infrastructure Cooperation はコメントを受け付けていません

Reliable Evaluation of Attribution Maps in CNNs: A Perturbation-Based Approach

要約 この論文では、畳み込みニューラル ネットワーク (CNN) の予測を解釈す … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Reliable Evaluation of Attribution Maps in CNNs: A Perturbation-Based Approach はコメントを受け付けていません

Evaluating Vision Transformer Models for Visual Quality Control in Industrial Manufacturing

要約 工業製造における機械学習の最も有望なユースケースの 1 つは、品質管理シス … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, I.2.m | Evaluating Vision Transformer Models for Visual Quality Control in Industrial Manufacturing はコメントを受け付けていません

Design-o-meter: Towards Evaluating and Refining Graphic Designs

要約 グラフィック デザインは、視覚的なコミュニケーションのための効果的な媒体で … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.HC | Design-o-meter: Towards Evaluating and Refining Graphic Designs はコメントを受け付けていません

LoRA-FAIR: Federated LoRA Fine-Tuning with Aggregation and Initialization Refinement

要約 基礎モデル (FM) は、タスク固有の微調整により、さまざまなタスクにわた … 続きを読む

カテゴリー: cs.CV, cs.LG | LoRA-FAIR: Federated LoRA Fine-Tuning with Aggregation and Initialization Refinement はコメントを受け付けていません

SwissADT: An Audio Description Translation System for Swiss Languages

要約 音声説明 (AD) は、視覚障害者および視覚障害者に提供される重要なアクセ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.HC | SwissADT: An Audio Description Translation System for Swiss Languages はコメントを受け付けていません

3D Convex Splatting: Radiance Field Rendering with 3D Smooth Convexes

要約 3D ガウス スプラッティング (3DGS) などの放射フィールド再構成の … 続きを読む

カテゴリー: cs.CV | 3D Convex Splatting: Radiance Field Rendering with 3D Smooth Convexes はコメントを受け付けていません

Exploring Foundation Models Fine-Tuning for Cytology Classification

要約 細胞診スライドはがんの診断と病期分類に不可欠なツールですが、その分析には時 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV, q-bio.QM | Exploring Foundation Models Fine-Tuning for Cytology Classification はコメントを受け付けていません

Large Multi-modal Models Can Interpret Features in Large Multi-modal Models

要約 大規模マルチモーダル モデル (LMM) の最近の進歩は、学術界と産業界の … 続きを読む

カテゴリー: cs.CL, cs.CV | Large Multi-modal Models Can Interpret Features in Large Multi-modal Models はコメントを受け付けていません

TIPO: Text to Image with Text Presampling for Prompt Optimization

要約 TIPO (Text to Image with text presamp … 続きを読む

カテゴリー: cs.CV | TIPO: Text to Image with Text Presampling for Prompt Optimization はコメントを受け付けていません