-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2022年6月
Identification via Retinal Vessels Combining LBP and HOG
要約 情報技術の発達と高度なセキュリティの必要性に伴い、さまざまな識別方法を使用 … 続きを読む
カテゴリー: cs.CV
Identification via Retinal Vessels Combining LBP and HOG はコメントを受け付けていません
Style-Content Disentanglement in Language-Image Pretraining Representations for Zero-Shot Sketch-to-Image Synthesis
要約 この作業では、トレーニングなしのゼロショットスケッチから画像への合成のため … 続きを読む
カテゴリー: cs.CV
Style-Content Disentanglement in Language-Image Pretraining Representations for Zero-Shot Sketch-to-Image Synthesis はコメントを受け付けていません
Egocentric Video-Language Pretraining
要約 ビデオテキストのダウンストリームタスクを幅広く進めるために転送可能な表現を … 続きを読む
Dynamic Kernel Selection for Improved Generalization and Memory Efficiency in Meta-learning
要約 勾配ベースのメタ学習方法は、メタトレーニングセットに過剰適合する傾向があり … 続きを読む
Gradient Obfuscation Checklist Test Gives a False Sense of Security
要約 敵対的攻撃に対する防御技術の一般的なグループの1つは、ネットワークに確率的 … 続きを読む
カテゴリー: cs.CV
Gradient Obfuscation Checklist Test Gives a False Sense of Security はコメントを受け付けていません
Transforming medical imaging with Transformers? A comparative review of key properties, current progresses, and future perspectives
要約 ディープラーニングの最新の技術的進歩であるTransformerは、自然言 … 続きを読む
カテゴリー: cs.CV
Transforming medical imaging with Transformers? A comparative review of key properties, current progresses, and future perspectives はコメントを受け付けていません
Exploring Visual Prompts for Adapting Large-Scale Models
要約 視覚に大規模モデルを適応させるための視覚的プロンプトの有効性を調査します。 … 続きを読む
カテゴリー: cs.CV
Exploring Visual Prompts for Adapting Large-Scale Models はコメントを受け付けていません
A-OKVQA: A Benchmark for Visual Question Answering using World Knowledge
要約 視覚的質問応答(VQA)タスクは、視覚的および自然言語入力を共同で推論でき … 続きを読む
Revisiting the ‘Video’ in Video-Language Understanding
要約 単一の画像から理解できることを超えて、ビデオタスクがビデオに独自に適してい … 続きを読む
SNAKE: Shape-aware Neural 3D Keypoint Field
要約 点群から3Dキーポイントを検出することは、形状の再構築にとって重要ですが、 … 続きを読む