-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年6月
SuperFormer: Volumetric Transformer Architectures for MRI Super-Resolution
要約 この論文では、Visual Transformers (ViT) を使用し … 続きを読む
Robust CLIP: Unsupervised Adversarial Fine-Tuning of Vision Embeddings for Robust Large Vision-Language Models
要約 OpenFlamingo、LLaVA、GPT-4 などのマルチモーダル基盤 … 続きを読む
CoopHash: Cooperative Learning of Multipurpose Descriptor and Contrastive Pair Generator via Variational MCMC Teaching for Supervised Image Hashing
要約 教師付き情報を活用すると、画像ハッシュ領域で優れた検索パフォーマンスが得ら … 続きを読む
AFF-ttention! Affordances and Attention models for Short-Term Object Interaction Anticipation
要約 短期的なオブジェクト インタラクション 予測は、自己中心的なビデオの観察か … 続きを読む
カテゴリー: cs.CV
AFF-ttention! Affordances and Attention models for Short-Term Object Interaction Anticipation はコメントを受け付けていません
SelfReDepth: Self-Supervised Real-Time Depth Restoration for Consumer-Grade Sensors
要約 民生用センサーによって生成された深度マップには、不正確な測定値や、システム … 続きを読む
Gaussian Representation for Deformable Image Registration
要約 変形可能な画像位置合わせ (DIR) は放射線治療における基本的なタスクで … 続きを読む
カテゴリー: cs.CV
Gaussian Representation for Deformable Image Registration はコメントを受け付けていません
How to Train Neural Field Representations: A Comprehensive Study and Benchmark
要約 ニューラル フィールド (NeF) は、画像、形状、シーンなどのさまざまな … 続きを読む
カテゴリー: cs.CV
How to Train Neural Field Representations: A Comprehensive Study and Benchmark はコメントを受け付けていません
Interactive Text-to-Image Retrieval with Large Language Models: A Plug-and-Play Approach
要約 このペーパーでは、対話型のテキストから画像への検索タスク内の対話形式のコン … 続きを読む
カテゴリー: cs.CV
Interactive Text-to-Image Retrieval with Large Language Models: A Plug-and-Play Approach はコメントを受け付けていません
UnWave-Net: Unrolled Wavelet Network for Compton Tomography Image Reconstruction
要約 コンピュータ断層撮影 (CT) は、体の内部構造をスキャンするために広く使 … 続きを読む
CoFie: Learning Compact Neural Surface Representations with Coordinate Fields
要約 この論文では、新しいローカル ジオメトリを認識したニューラル サーフェス表 … 続きを読む