-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年8月
Large Point-to-Gaussian Model for Image-to-3D Generation
要約 最近、画像から 3D へのアプローチにより、大規模な再構成モデル、特に … 続きを読む
カテゴリー: cs.CV
Large Point-to-Gaussian Model for Image-to-3D Generation はコメントを受け付けていません
A Closer Look at Data Augmentation Strategies for Finetuning-Based Low/Few-Shot Object Detection
要約 低ショットおよび少数ショットの物体検出のための現在の方法は、主に物体を検出 … 続きを読む
Self-Supervised Disentanglement by Leveraging Structure in Data Augmentations
要約 自己教師あり表現学習では、多くの場合、データ拡張を使用して、データの「スタ … 続きを読む
HiRED: Attention-Guided Token Dropping for Efficient Inference of High-Resolution Vision-Language Models in Resource-Constrained Environments
要約 高解像度の視覚言語モデル (VLM) は、詳細な画像情報を保存することで精 … 続きを読む
Multichannel Attention Networks with Ensembled Transfer Learning to Recognize Bangla Handwritten Charecter
要約 ベンガル語は、世界で 5 番目に多く話されているネイティブ言語であり、世界 … 続きを読む
カテゴリー: cs.CV
Multichannel Attention Networks with Ensembled Transfer Learning to Recognize Bangla Handwritten Charecter はコメントを受け付けていません
SR+Codec: a Benchmark of Super-Resolution for Video Compression Bitrate Reduction
要約 近年、低解像度の入力から高解像度の画像を生成することに焦点を当てた超解像度 … 続きを読む
ISLES’24: Improving final infarct prediction in ischemic stroke using multimodal imaging and clinical data
要約 虚血性脳卒中治療の決定には、コア(不可逆的に損傷した組織)とペナンブラ(回 … 続きを読む
Denoising Plane Wave Ultrasound Images Using Diffusion Probabilistic Models
要約 超音波平面波イメージングは、高フレームレートのイメージングを可能にする … 続きを読む
Efficient and Robust Quantization-aware Training via Adaptive Coreset Selection
要約 量子化対応トレーニング (QAT) は、重みとアクティベーションの冗長性を … 続きを読む
Facial Demorphing via Identity Preserving Image Decomposition
要約 顔モーフは、通常 2 つの異なるアイデンティティに関連する顔画像を結合する … 続きを読む
カテゴリー: cs.CV
Facial Demorphing via Identity Preserving Image Decomposition はコメントを受け付けていません