投稿者「jarxiv」のアーカイブ

Automation of Quantum Dot Measurement Analysis via Explainable Machine Learning

要約 量子コンピューティング用の量子ドット (QD) デバイスの急速な開発により … 続きを読む

カテゴリー: cond-mat.mes-hall, cs.CV, cs.LG | Automation of Quantum Dot Measurement Analysis via Explainable Machine Learning はコメントを受け付けていません

A Survey on Dynamic Neural Networks: from Computer Vision to Multi-modal Sensor Fusion

要約 モデル圧縮は、組み込みデバイス上に大規模な Computer Vision … 続きを読む

カテゴリー: 68T45, cs.CV, I.2.10 | A Survey on Dynamic Neural Networks: from Computer Vision to Multi-modal Sensor Fusion はコメントを受け付けていません

ScVLM: Enhancing Vision-Language Model for Safety-Critical Event Understanding

要約 衝突、タイヤ衝突、衝突寸前などの交通安全上重要なイベント (SCE) を正 … 続きを読む

カテゴリー: cs.CV | ScVLM: Enhancing Vision-Language Model for Safety-Critical Event Understanding はコメントを受け付けていません

Rethinking Decoders for Transformer-based Semantic Segmentation: A Compression Perspective

要約 Transformer ベースのセマンティック セグメンテーションの最先端 … 続きを読む

カテゴリー: cs.CV, cs.LG | Rethinking Decoders for Transformer-based Semantic Segmentation: A Compression Perspective はコメントを受け付けていません

3DGS-to-PC: Convert a 3D Gaussian Splatting Scene into a Dense Point Cloud or Mesh

要約 3D ガウス スプラッティング (3DGS) は、非常に詳細な 3D 再構 … 続きを読む

カテゴリー: cs.CV, cs.GR, I.2.10 | 3DGS-to-PC: Convert a 3D Gaussian Splatting Scene into a Dense Point Cloud or Mesh はコメントを受け付けていません

Agentic Copyright Watermarking against Adversarial Evidence Forgery with Purification-Agnostic Curriculum Proxy Learning

要約 さまざまなドメインで AI エージェントが急増するにつれて、AI モデルの … 続きを読む

カテゴリー: cs.CR, cs.CV | Agentic Copyright Watermarking against Adversarial Evidence Forgery with Purification-Agnostic Curriculum Proxy Learning はコメントを受け付けていません

Aligning First, Then Fusing: A Novel Weakly Supervised Multimodal Violence Detection Method

要約 弱く監視された暴力検出とは、ビデオレベルのラベルのみを使用してビデオ内の暴 … 続きを読む

カテゴリー: cs.CV | Aligning First, Then Fusing: A Novel Weakly Supervised Multimodal Violence Detection Method はコメントを受け付けていません

RAD-DINO: Exploring Scalable Medical Image Encoders Beyond Text Supervision

要約 言語教師付き事前トレーニングは、画像から意味的に意味のある特徴を抽出するた … 続きを読む

カテゴリー: cs.CV | RAD-DINO: Exploring Scalable Medical Image Encoders Beyond Text Supervision はコメントを受け付けていません

Three-view Focal Length Recovery From Homographies

要約 この論文では、3 視点ホモグラフィーから焦点距離を回復するための新しいアプ … 続きを読む

カテゴリー: cs.CV | Three-view Focal Length Recovery From Homographies はコメントを受け付けていません

Arc2Avatar: Generating Expressive 3D Avatars from a Single Image via ID Guidance

要約 マルチビュー設定内で詳細な 3D シーンを再構成する 3D ガウス スプラ … 続きを読む

カテゴリー: cs.CV | Arc2Avatar: Generating Expressive 3D Avatars from a Single Image via ID Guidance はコメントを受け付けていません