「cs.CV」カテゴリーアーカイブ

LiDAR-based End-to-end Temporal Perception for Vehicle-Infrastructure Cooperation

投稿日: 2024年11月25日作成者: jarxiv

要約時間的知覚、つまり時間の経過とともに物体を検出して追跡する能力は、自動運転 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Reliable Evaluation of Attribution Maps in CNNs: A Perturbation-Based Approach

投稿日: 2024年11月25日作成者: jarxiv

要約この論文では、畳み込みニューラルネットワーク (CNN) の予測を解釈す … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Evaluating Vision Transformer Models for Visual Quality Control in Industrial Manufacturing

投稿日: 2024年11月25日作成者: jarxiv

要約工業製造における機械学習の最も有望なユースケースの 1 つは、品質管理シス … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, I.2.m | コメントを受け付けていません

Design-o-meter: Towards Evaluating and Refining Graphic Designs

投稿日: 2024年11月25日作成者: jarxiv

要約グラフィックデザインは、視覚的なコミュニケーションのための効果的な媒体で … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.HC | コメントを受け付けていません

LoRA-FAIR: Federated LoRA Fine-Tuning with Aggregation and Initialization Refinement

投稿日: 2024年11月25日作成者: jarxiv

要約基礎モデル (FM) は、タスク固有の微調整により、さまざまなタスクにわた … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

SwissADT: An Audio Description Translation System for Swiss Languages

投稿日: 2024年11月25日作成者: jarxiv

要約音声説明 (AD) は、視覚障害者および視覚障害者に提供される重要なアクセ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.HC | コメントを受け付けていません

3D Convex Splatting: Radiance Field Rendering with 3D Smooth Convexes

投稿日: 2024年11月25日作成者: jarxiv

要約 3D ガウススプラッティング (3DGS) などの放射フィールド再構成の … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Exploring Foundation Models Fine-Tuning for Cytology Classification

投稿日: 2024年11月25日作成者: jarxiv

要約細胞診スライドはがんの診断と病期分類に不可欠なツールですが、その分析には時 … 続きを読む →

カテゴリー: cs.AI, cs.CV, eess.IV, q-bio.QM | コメントを受け付けていません

Large Multi-modal Models Can Interpret Features in Large Multi-modal Models

投稿日: 2024年11月25日作成者: jarxiv

要約大規模マルチモーダルモデル (LMM) の最近の進歩は、学術界と産業界の … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

TIPO: Text to Image with Text Presampling for Prompt Optimization

投稿日: 2024年11月25日作成者: jarxiv

要約 TIPO (Text to Image with text presamp … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

LiDAR-based End-to-end Temporal Perception for Vehicle-Infrastructure Cooperation

Reliable Evaluation of Attribution Maps in CNNs: A Perturbation-Based Approach

Evaluating Vision Transformer Models for Visual Quality Control in Industrial Manufacturing

Design-o-meter: Towards Evaluating and Refining Graphic Designs

LoRA-FAIR: Federated LoRA Fine-Tuning with Aggregation and Initialization Refinement

SwissADT: An Audio Description Translation System for Swiss Languages

3D Convex Splatting: Radiance Field Rendering with 3D Smooth Convexes

Exploring Foundation Models Fine-Tuning for Cytology Classification

Large Multi-modal Models Can Interpret Features in Large Multi-modal Models

TIPO: Text to Image with Text Presampling for Prompt Optimization

最近の投稿

最近のコメント

アーカイブ

カテゴリー