cs.LG」カテゴリーアーカイブ

The Streetscape Application Services Stack (SASS): Towards a Distributed Sensing Architecture for Urban Applications

要約 都市人口の増加に伴い都市はより複雑化しており、スマートシティのビジョンを実 … 続きを読む

カテゴリー: cs.CV, cs.DC, cs.LG, cs.NI | The Streetscape Application Services Stack (SASS): Towards a Distributed Sensing Architecture for Urban Applications はコメントを受け付けていません

Forensics Adapter: Adapting CLIP for Generalizable Face Forgery Detection

要約 CLIP を効果的で汎用的な顔偽造検出器に変換するために設計されたアダプタ … 続きを読む

カテゴリー: cs.CR, cs.CV, cs.LG | Forensics Adapter: Adapting CLIP for Generalizable Face Forgery Detection はコメントを受け付けていません

MonoPP: Metric-Scaled Self-Supervised Monocular Depth Estimation by Planar-Parallax Geometry in Automotive Applications

要約 自己教師あり単眼深度推定 (MDE) は、ビデオから直接深度予測を取得する … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | MonoPP: Metric-Scaled Self-Supervised Monocular Depth Estimation by Planar-Parallax Geometry in Automotive Applications はコメントを受け付けていません

JetFormer: An Autoregressive Generative Model of Raw Images and Text

要約 モデリングの制約を取り除き、ドメイン全体でアーキテクチャを統合することが、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | JetFormer: An Autoregressive Generative Model of Raw Images and Text はコメントを受け付けていません

Real-Time Anomaly Detection in Video Streams

要約 この論文は、Othello 社と LIASD 研究室との間の CIFRE … 続きを読む

カテゴリー: cs.CV, cs.LG | Real-Time Anomaly Detection in Video Streams はコメントを受け付けていません

CLIPArTT: Adaptation of CLIP to New Domains at Test Time

要約 CLIP に代表される、事前トレーニング済みのビジョン言語モデル (VLM … 続きを読む

カテゴリー: cs.CV, cs.LG | CLIPArTT: Adaptation of CLIP to New Domains at Test Time はコメントを受け付けていません

A Multi-Loss Strategy for Vehicle Trajectory Prediction: Combining Off-Road, Diversity, and Directional Consistency Losses

要約 軌道予測は、自動運転車の計画の安全性と効率性にとって不可欠です。 しかし、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MA, cs.RO | A Multi-Loss Strategy for Vehicle Trajectory Prediction: Combining Off-Road, Diversity, and Directional Consistency Losses はコメントを受け付けていません

Domain-Adaptive Pre-training of Self-Supervised Foundation Models for Medical Image Classification in Gastrointestinal Endoscopy

要約 ビデオ カプセル内視鏡は、消化管の詳細な画像を取得する非侵襲的な方法を提供 … 続きを読む

カテゴリー: cs.CV, cs.LG | Domain-Adaptive Pre-training of Self-Supervised Foundation Models for Medical Image Classification in Gastrointestinal Endoscopy はコメントを受け付けていません

DeSplat: Decomposed Gaussian Splatting for Distractor-Free Rendering

要約 ガウス スプラッティングにより、静的な 3D 環境での新しいビューの高速合 … 続きを読む

カテゴリー: cs.CV, cs.LG | DeSplat: Decomposed Gaussian Splatting for Distractor-Free Rendering はコメントを受け付けていません

Dual Risk Minimization: Towards Next-Level Robustness in Fine-tuning Zero-Shot Models

要約 基礎モデルを微調整すると、分布の変化に対する堅牢性が損なわれることがよくあ … 続きを読む

カテゴリー: cs.CV, cs.LG | Dual Risk Minimization: Towards Next-Level Robustness in Fine-tuning Zero-Shot Models はコメントを受け付けていません