-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年1月
Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data
要約 この研究では、ロバストな単眼奥行き推定のための非常に実用的なソリューション … 続きを読む
カテゴリー: cs.CV
Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data はコメントを受け付けていません
Imitation Learning Inputting Image Feature to Each Layer of Neural Network
要約 模倣学習により、ロボットはトレーニング データから人間の行動を学習し、再現 … 続きを読む
Hierarchical Masked 3D Diffusion Model for Video Outpainting
要約 ビデオ アウトペイントは、ビデオ フレームの端にある欠落領域を適切に補完す … 続きを読む
カテゴリー: cs.CV
Hierarchical Masked 3D Diffusion Model for Video Outpainting はコメントを受け付けていません
Benchmarking Robustness of Multimodal Image-Text Models under Distribution Shift
要約 マルチモーダル画像テキストモデルは、過去数年間で目覚ましいパフォーマンスを … 続きを読む
カテゴリー: cs.CV
Benchmarking Robustness of Multimodal Image-Text Models under Distribution Shift はコメントを受け付けていません
Divide and not forget: Ensemble of selectively trained experts in Continual Learning
要約 クラス増分学習は、すでに知っていることを忘れずにモデルの適用範囲を広げるの … 続きを読む
Better Explain Transformers by Illuminating Important Information
要約 Transformer ベースのモデルは、さまざまな自然言語処理 (NLP … 続きを読む
カテゴリー: cs.CL
Better Explain Transformers by Illuminating Important Information はコメントを受け付けていません
Cross-Modality Perturbation Synergy Attack for Person Re-identification
要約 近年、RGB 画像に基づくシングルモーダル個人再識別 (ReID) システ … 続きを読む
カテゴリー: cs.CV
Cross-Modality Perturbation Synergy Attack for Person Re-identification はコメントを受け付けていません
VIPTR: A Vision Permutable Extractor for Fast and Efficient Scene Text Recognition
要約 シーン テキスト認識 (STR) は、自然のシーンの画像内のテキストを認識 … 続きを読む
カテゴリー: cs.CV
VIPTR: A Vision Permutable Extractor for Fast and Efficient Scene Text Recognition はコメントを受け付けていません
Motion-Zero: Zero-Shot Moving Object Control Framework for Diffusion-Based Video Generation
要約 最近の大規模な事前トレーニング済み拡散モデルは、詳細なテキストの説明から高 … 続きを読む
カテゴリー: cs.CV
Motion-Zero: Zero-Shot Moving Object Control Framework for Diffusion-Based Video Generation はコメントを受け付けていません
Port-Hamiltonian Neural ODE Networks on Lie Groups For Robot Dynamics Learning and Control
要約 ロボットのダイナミクスの正確なモデルは、安全で安定した制御と新しい動作条件 … 続きを読む