-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年1月
Distribution Matching for Multi-Task Learning of Classification Tasks: a Large-Scale Study on Faces & Beyond
要約 マルチタスク学習 (MTL) は、複数の関連タスクが共同で学習され、共有表 … 続きを読む
カテゴリー: cs.CV
Distribution Matching for Multi-Task Learning of Classification Tasks: a Large-Scale Study on Faces & Beyond はコメントを受け付けていません
Exploiting Causality Signals in Medical Images: A Pilot Study with Empirical Results
要約 我々は、分類目的でニューラルネットワークを介して画像から弱い因果信号を直接 … 続きを読む
PointDC:Unsupervised Semantic Segmentation of 3D Point Clouds via Cross-modal Distillation and Super-Voxel Clustering
要約 点群のセマンティック セグメンテーションには、通常、人間による注釈の骨の折 … 続きを読む
カテゴリー: cs.CV
PointDC:Unsupervised Semantic Segmentation of 3D Point Clouds via Cross-modal Distillation and Super-Voxel Clustering はコメントを受け付けていません
IdentiFace : A VGG Based Multimodal Facial Biometric System
要約 顔生体認証システムの開発は、コンピュータ ビジョン分野の発展に大きく貢献し … 続きを読む
Data-Efficient Multimodal Fusion on a Single GPU
要約 マルチモーダル アライメントの目標は、マルチモーダル入力間で共有される単一 … 続きを読む
Temporal Adaptive RGBT Tracking with Modality Prompt
要約 RGBT トラッキングは、ロボット工学、監視処理、自動運転などのさまざまな … 続きを読む
カテゴリー: cs.CV
Temporal Adaptive RGBT Tracking with Modality Prompt はコメントを受け付けていません
Deep Learning-Based Computational Model for Disease Identification in Cocoa Pods (Theobroma cacao L.)
要約 カカオの実の病気を早期に特定することは、高品質のカカオの生産を保証するため … 続きを読む
カテゴリー: cs.CV
Deep Learning-Based Computational Model for Disease Identification in Cocoa Pods (Theobroma cacao L.) はコメントを受け付けていません
ArtGPT-4: Towards Artistic-understanding Large Vision-Language Models with Enhanced Adapter
要約 近年、大規模言語モデルの進歩は目覚ましく、ChatGPT などのモデルはさ … 続きを読む
Recovering 3D Human Mesh from Monocular Images: A Survey
要約 単眼画像から人間の姿勢や形状を推定することは、コンピューター ビジョンにお … 続きを読む
VideoDrafter: Content-Consistent Multi-Scene Video Generation with LLM
要約 拡散モデルにおける最近の技術革新と画期的な進歩により、指定されたプロンプト … 続きを読む