-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
DRAGON: A Large-Scale Dataset of Realistic Images Generated by Diffusion Models
要約 画像生成のために拡散モデルの顕著な使いやすさにより、オンラインで合成コンテ … 続きを読む
Multi-view dense image matching with similarity learning and geometry priors
要約 マルチビューの類似性学習のために設計された深いニューラルネットワークの包括 … 続きを読む
カテゴリー: cs.CV
Multi-view dense image matching with similarity learning and geometry priors はコメントを受け付けていません
TwinTURBO: Semi-Supervised Fine-Tuning of Foundation Models via Mutual Information Decompositions for Downstream Task and Latent Spaces
要約 限られた量のラベル付きデータのトレーニングの課題に対処するために相互情報分 … 続きを読む
Equal is Not Always Fair: A New Perspective on Hyperspectral Representation Non-Uniformity
要約 ハイパースペクトル画像(HSI)表現は、スペクトル依存性、空間連続性、およ … 続きを読む
A Fourier Space Perspective on Diffusion Models
要約 拡散モデルは、画像、オーディオ、タンパク質、材料などのデータモダリティに関 … 続きを読む
Communication-Efficient Federated Learning Based on Explanation-Guided Pruning for Remote Sensing Image Classification
要約 Federated Learning(FL)は、クライアントのローカルデー … 続きを読む
VIN-NBV: A View Introspection Network for Next-Best-View Selection for Resource-Efficient 3D Reconstruction
要約 次のBest View(NBV)アルゴリズムは、シーンの効率的な3D再構築 … 続きを読む
MTevent: A Multi-Task Event Camera Dataset for 6D Pose Estimation and Moving Object Detection
要約 モバイルロボットは前例のない速度に達しており、Unitree B2やFra … 続きを読む
カテゴリー: cs.CV
MTevent: A Multi-Task Event Camera Dataset for 6D Pose Estimation and Moving Object Detection はコメントを受け付けていません
Espresso: High Compression For Rich Extraction From Videos for Your Vision-Language Model
要約 ビジョン言語モデル(VLM)の最近の進歩は、画像とテキストを接続することに … 続きを読む
カテゴリー: cs.CV
Espresso: High Compression For Rich Extraction From Videos for Your Vision-Language Model はコメントを受け付けていません
Breaking the Batch Barrier (B3) of Contrastive Learning via Smart Batch Mining
要約 Contrastive Learning(CL)は、埋め込みモデルをトレー … 続きを読む
カテゴリー: cs.CV
Breaking the Batch Barrier (B3) of Contrastive Learning via Smart Batch Mining はコメントを受け付けていません