-
最近の投稿
- QueryCAD: Grounded Question Answering for CAD Models
- Reward-Centered ReST-MCTS: A Robust Decision-Making Framework for Robotic Manipulation in High Uncertainty Environments
- Discrete Contrastive Learning for Diffusion Policies in Autonomous Driving
- HBTP: Heuristic Behavior Tree Planning with Large Language Model Reasoning
- Kaiwu: A Multimodal Manipulation Dataset and Framework for Robot Learning and Human-Robot Interaction
-
最近のコメント
表示できるコメントはありません。 cs.AI (34805) cs.CL (26316) cs.CR (2669) cs.CV (40628) cs.LG (39812) cs.RO (20399) cs.SY (3096) eess.IV (4823) eess.SY (3090) stat.ML (5236)
月別アーカイブ: 2023年8月
Data-Centric Diet: Effective Multi-center Dataset Pruning for Medical Image Segmentation
要約 この論文は、精度をあまり犠牲にすることなく、データセットのかなりの部分 … 続きを読む
Improving Generalization in Visual Reinforcement Learning via Conflict-aware Gradient Agreement Augmentation
要約 目に見えない環境への大きな一般化を伴うポリシーを学習することは依然として困 … 続きを読む
カテゴリー: cs.CV
Improving Generalization in Visual Reinforcement Learning via Conflict-aware Gradient Agreement Augmentation はコメントを受け付けていません
TeachCLIP: Multi-Grained Teaching for Efficient Text-to-Video Retrieval
要約 アドホック テキスト クエリによってラベルのないビデオを取得することを目的 … 続きを読む
カテゴリー: cs.CV
TeachCLIP: Multi-Grained Teaching for Efficient Text-to-Video Retrieval はコメントを受け付けていません
Evolutionary Augmentation Policy Optimization for Self-supervised Learning
要約 自己教師あり学習 (SSL) は、手動でラベル付けされたデータを必要とせず … 続きを読む
Grounded Image Text Matching with Mismatched Relation Reasoning
要約 この論文では、トランスフォーマーベースの事前トレーニング済みモデルの関係理 … 続きを読む
CMUNeXt: An Efficient Medical Image Segmentation Network based on Large Kernel and Skip Fusion
要約 U 字型アーキテクチャは、医療画像セグメンテーション ネットワークの設計に … 続きを読む
Tirtha — An Automated Platform to Crowdsource Images and Create 3D Models of Heritage Sites
要約 文化遺産 (CH) のデジタル保存は、自然災害や人間の活動による被害から保 … 続きを読む
A Hybrid Approach To Real-Time Multi-Object Tracking
要約 マルチターゲット トラッキングとも呼ばれるマルチオブジェクト トラッキング … 続きを読む
カテゴリー: cs.CV
A Hybrid Approach To Real-Time Multi-Object Tracking はコメントを受け付けていません
Automated wildlife image classification: An active learning tool for ecological applications
要約 野生動物のカメラトラップ画像は、動物の生息数、生息地の関連性、行動を調査す … 続きを読む
InFusion: Inject and Attention Fusion for Multi Concept Zero Shot Text based Video Editing
要約 大規模なテキストから画像への拡散モデルは、入力画像の編集に使用されるテキス … 続きを読む
カテゴリー: cs.CV
InFusion: Inject and Attention Fusion for Multi Concept Zero Shot Text based Video Editing はコメントを受け付けていません