-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
Compensating Spatiotemporally Inconsistent Observations for Online Dynamic 3D Gaussian Splatting
要約 動的シーンのオンライン再構成は、既存のオフライン動的再構成手法が録画された … 続きを読む
カテゴリー: cs.CV
Compensating Spatiotemporally Inconsistent Observations for Online Dynamic 3D Gaussian Splatting はコメントを受け付けていません
CAV-MAE Sync: Improving Contrastive Audio-Visual Mask Autoencoders via Fine-Grained Alignment
要約 オーディオビジュアル学習における最近の進歩は、モダリティを超えた表現の学習 … 続きを読む
Can Foundation Models Really Segment Tumors? A Benchmarking Odyssey in Lung CT Imaging
要約 正確な肺腫瘍のセグメンテーションは、腫瘍学の診断、治療計画、患者の転帰を改 … 続きを読む
Fusing Foveal Fixations Using Linear Retinal Transformations and Bayesian Experimental Design
要約 人間(および多くの脊椎動物)は、シーンの複数の固視を融合して全体の表現を得 … 続きを読む
CAMELTrack: Context-Aware Multi-cue ExpLoitation for Online Multi-Object Tracking
要約 オンラインマルチオブジェクトトラッキングは、トラックレット表現、特徴フュー … 続きを読む
FlowDubber: Movie Dubbing with LLM-based Semantic-aware Learning and Flow Matching based Voice Enhancing
要約 ムービーダビングは、与えられた短い参照音声のボーカルの音色を維持しながら、 … 続きを読む
Diffusion-based Adversarial Purification from the Perspective of the Frequency Domain
要約 拡散に基づく敵対的浄化法は、順方向処理によって敵対的摂動を等方性ノイズの一 … 続きを読む
カテゴリー: cs.CV
Diffusion-based Adversarial Purification from the Perspective of the Frequency Domain はコメントを受け付けていません
MASH: Masked Anchored SpHerical Distances for 3D Shape Representation and Generation
要約 我々は、3D形状の新しいマルチビュー・パラメトリック表現であるMasked … 続きを読む
A Neural Architecture Search Method using Auxiliary Evaluation Metric based on ResNet Architecture
要約 本稿では、ResNetをフレームワークとして用いたニューラル・アーキテクチ … 続きを読む
FreeInsert: Disentangled Text-Guided Object Insertion in 3D Gaussian Scene without Spatial Priors
要約 3Dシーンにおけるテキスト駆動オブジェクト挿入は、自然言語による直感的なシ … 続きを読む
カテゴリー: cs.CV
FreeInsert: Disentangled Text-Guided Object Insertion in 3D Gaussian Scene without Spatial Priors はコメントを受け付けていません