月別アーカイブ: 2024年1月

Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data

要約 この研究では、ロバストな単眼奥行き推定のための非常に実用的なソリューション … 続きを読む

カテゴリー: cs.CV | Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data はコメントを受け付けていません

Imitation Learning Inputting Image Feature to Each Layer of Neural Network

要約 模倣学習により、ロボットはトレーニング データから人間の行動を学習し、再現 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Imitation Learning Inputting Image Feature to Each Layer of Neural Network はコメントを受け付けていません

Hierarchical Masked 3D Diffusion Model for Video Outpainting

要約 ビデオ アウトペイントは、ビデオ フレームの端にある欠落領域を適切に補完す … 続きを読む

カテゴリー: cs.CV | Hierarchical Masked 3D Diffusion Model for Video Outpainting はコメントを受け付けていません

Benchmarking Robustness of Multimodal Image-Text Models under Distribution Shift

要約 マルチモーダル画像テキストモデルは、過去数年間で目覚ましいパフォーマンスを … 続きを読む

カテゴリー: cs.CV | Benchmarking Robustness of Multimodal Image-Text Models under Distribution Shift はコメントを受け付けていません

Divide and not forget: Ensemble of selectively trained experts in Continual Learning

要約 クラス増分学習は、すでに知っていることを忘れずにモデルの適用範囲を広げるの … 続きを読む

カテゴリー: cs.CV, cs.LG | Divide and not forget: Ensemble of selectively trained experts in Continual Learning はコメントを受け付けていません

Better Explain Transformers by Illuminating Important Information

要約 Transformer ベースのモデルは、さまざまな自然言語処理 (NLP … 続きを読む

カテゴリー: cs.CL | Better Explain Transformers by Illuminating Important Information はコメントを受け付けていません

Cross-Modality Perturbation Synergy Attack for Person Re-identification

要約 近年、RGB 画像に基づくシングルモーダル個人再識別 (ReID) システ … 続きを読む

カテゴリー: cs.CV | Cross-Modality Perturbation Synergy Attack for Person Re-identification はコメントを受け付けていません

VIPTR: A Vision Permutable Extractor for Fast and Efficient Scene Text Recognition

要約 シーン テキスト認識 (STR) は、自然のシーンの画像内のテキストを認識 … 続きを読む

カテゴリー: cs.CV | VIPTR: A Vision Permutable Extractor for Fast and Efficient Scene Text Recognition はコメントを受け付けていません

Motion-Zero: Zero-Shot Moving Object Control Framework for Diffusion-Based Video Generation

要約 最近の大規模な事前トレーニング済み拡散モデルは、詳細なテキストの説明から高 … 続きを読む

カテゴリー: cs.CV | Motion-Zero: Zero-Shot Moving Object Control Framework for Diffusion-Based Video Generation はコメントを受け付けていません

Port-Hamiltonian Neural ODE Networks on Lie Groups For Robot Dynamics Learning and Control

要約 ロボットのダイナミクスの正確なモデルは、安全で安定した制御と新しい動作条件 … 続きを読む

カテゴリー: cs.RO, cs.SY, eess.SY | Port-Hamiltonian Neural ODE Networks on Lie Groups For Robot Dynamics Learning and Control はコメントを受け付けていません