-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年7月
Multi-label Cluster Discrimination for Visual Representation Learning
要約 対照言語画像事前トレーニング (CLIP) は、画像とテキストの対照学習に … 続きを読む
カテゴリー: cs.CV
Multi-label Cluster Discrimination for Visual Representation Learning はコメントを受け付けていません
Cascaded Light Propagation Volumes using Spherical Radial Basis Functions
要約 このペーパーでは、動的シーンで間接照明をシミュレートするための最新の方法の … 続きを読む
Preliminary study on artificial intelligence methods for cybersecurity threat detection in computer networks based on raw data packets
要約 コンピュータ ネットワークにおける侵入検出方法のほとんどは、トラフィック … 続きを読む
MM-Soc: Benchmarking Multimodal Large Language Models in Social Media Platforms
要約 ソーシャル メディア プラットフォームは、テキスト、画像、ビデオを含むマル … 続きを読む
Deep Spherical Superpixels
要約 長年にわたり、スーパーピクセル セグメンテーションの使用はさまざまなアプリ … 続きを読む
カテゴリー: cs.CV
Deep Spherical Superpixels はコメントを受け付けていません
MuST: Multi-Scale Transformers for Surgical Phase Recognition
要約 手術ビデオにおける位相認識は、一連の手術段階の自動理解を可能にするため、コ … 続きを読む
ViPer: Visual Personalization of Generative Models via Individual Preference Learning
要約 異なるユーザーは、同じプロンプトに対して生成された異なる画像が望ましいと感 … 続きを読む
カテゴリー: cs.CV
ViPer: Visual Personalization of Generative Models via Individual Preference Learning はコメントを受け付けていません
PrevPredMap: Exploring Temporal Modeling with Previous Predictions for Online Vectorized HD Map Construction
要約 時間情報は、遮蔽されたインスタンスを検出するために重要です。 既存の時間表 … 続きを読む
カテゴリー: cs.CV
PrevPredMap: Exploring Temporal Modeling with Previous Predictions for Online Vectorized HD Map Construction はコメントを受け付けていません
MMRA: A Benchmark for Multi-granularity Multi-image Relational Association
要約 大規模視覚言語モデル (LVLM) が画像認識タスクで達成した目覚ましい成 … 続きを読む
MetaCap: Meta-learning Priors from Multi-View Imagery for Sparse-view Human Performance Capture and Rendering
要約 人間のパフォーマンスを忠実にキャプチャし、まばらな RGB 観察からフリー … 続きを読む
カテゴリー: cs.CV
MetaCap: Meta-learning Priors from Multi-View Imagery for Sparse-view Human Performance Capture and Rendering はコメントを受け付けていません