-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年3月
Generic 3D Diffusion Adapter Using Controlled Multi-View Editing
要約 オープンドメインの 3D オブジェクト合成は、データが限られていて計算が複 … 続きを読む
MEDBind: Unifying Language and Multimodal Medical Data Embeddings
要約 医療視覚言語事前トレーニング モデル (VLPM) は、胸部 X 線 (C … 続きを読む
カテゴリー: cs.CV
MEDBind: Unifying Language and Multimodal Medical Data Embeddings はコメントを受け付けていません
mPLUG-DocOwl 1.5: Unified Structure Learning for OCR-free Document Understanding
要約 構造情報は、文書、表、グラフなどのテキストの多い画像のセマンティクスを理解 … 続きを読む
カテゴリー: cs.CV
mPLUG-DocOwl 1.5: Unified Structure Learning for OCR-free Document Understanding はコメントを受け付けていません
SynCDR : Training Cross Domain Retrieval Models with Synthetic Data
要約 クロスドメイン検索では、2 つの視覚ドメインにわたって同じ意味カテゴリから … 続きを読む
TexDreamer: Towards Zero-Shot High-Fidelity 3D Human Texture Generation
要約 適切に展開された UV を取得することが難しいため、セマンティック UV … 続きを読む
カテゴリー: cs.CV
TexDreamer: Towards Zero-Shot High-Fidelity 3D Human Texture Generation はコメントを受け付けていません
Self-Supervised Learning for Image Super-Resolution and Deblurring
要約 自己教師あり手法は、さまざまなイメージング逆問題において教師あり手法とほぼ … 続きを読む
Vertical Federated Image Segmentation
要約 画像ベースの問題に対する AI ソリューションの普及に伴い、データのプライ … 続きを読む
Ultra-High-Resolution Image Synthesis with Pyramid Diffusion Model
要約 超高解像度画像合成用に設計された新しいアーキテクチャであるピラミッド拡散モ … 続きを読む
カテゴリー: cs.CV
Ultra-High-Resolution Image Synthesis with Pyramid Diffusion Model はコメントを受け付けていません
Align before Adapt: Leveraging Entity-to-Region Alignments for Generalizable Video Action Recognition
要約 大規模な視覚言語の事前トレーニング済みモデルは、さまざまなビデオ タスクで … 続きを読む
Exploring Facial Expression Recognition through Semi-Supervised Pretraining and Temporal Modeling
要約 顔表情認識 (FER) は、コンピュータ ビジョンにおいて重要な役割を果た … 続きを読む