-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
Automation of Quantum Dot Measurement Analysis via Explainable Machine Learning
要約 量子コンピューティング用の量子ドット (QD) デバイスの急速な開発により … 続きを読む
カテゴリー: cond-mat.mes-hall, cs.CV, cs.LG
Automation of Quantum Dot Measurement Analysis via Explainable Machine Learning はコメントを受け付けていません
A Survey on Dynamic Neural Networks: from Computer Vision to Multi-modal Sensor Fusion
要約 モデル圧縮は、組み込みデバイス上に大規模な Computer Vision … 続きを読む
ScVLM: Enhancing Vision-Language Model for Safety-Critical Event Understanding
要約 衝突、タイヤ衝突、衝突寸前などの交通安全上重要なイベント (SCE) を正 … 続きを読む
カテゴリー: cs.CV
ScVLM: Enhancing Vision-Language Model for Safety-Critical Event Understanding はコメントを受け付けていません
Rethinking Decoders for Transformer-based Semantic Segmentation: A Compression Perspective
要約 Transformer ベースのセマンティック セグメンテーションの最先端 … 続きを読む
3DGS-to-PC: Convert a 3D Gaussian Splatting Scene into a Dense Point Cloud or Mesh
要約 3D ガウス スプラッティング (3DGS) は、非常に詳細な 3D 再構 … 続きを読む
Agentic Copyright Watermarking against Adversarial Evidence Forgery with Purification-Agnostic Curriculum Proxy Learning
要約 さまざまなドメインで AI エージェントが急増するにつれて、AI モデルの … 続きを読む
Aligning First, Then Fusing: A Novel Weakly Supervised Multimodal Violence Detection Method
要約 弱く監視された暴力検出とは、ビデオレベルのラベルのみを使用してビデオ内の暴 … 続きを読む
カテゴリー: cs.CV
Aligning First, Then Fusing: A Novel Weakly Supervised Multimodal Violence Detection Method はコメントを受け付けていません
RAD-DINO: Exploring Scalable Medical Image Encoders Beyond Text Supervision
要約 言語教師付き事前トレーニングは、画像から意味的に意味のある特徴を抽出するた … 続きを読む
カテゴリー: cs.CV
RAD-DINO: Exploring Scalable Medical Image Encoders Beyond Text Supervision はコメントを受け付けていません
Three-view Focal Length Recovery From Homographies
要約 この論文では、3 視点ホモグラフィーから焦点距離を回復するための新しいアプ … 続きを読む
カテゴリー: cs.CV
Three-view Focal Length Recovery From Homographies はコメントを受け付けていません
Arc2Avatar: Generating Expressive 3D Avatars from a Single Image via ID Guidance
要約 マルチビュー設定内で詳細な 3D シーンを再構成する 3D ガウス スプラ … 続きを読む
カテゴリー: cs.CV
Arc2Avatar: Generating Expressive 3D Avatars from a Single Image via ID Guidance はコメントを受け付けていません