-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2023年5月
PMC-VQA: Visual Instruction Tuning for Medical Visual Question Answering
要約 この論文では、重要な臨床関連情報を含む医用画像を効率的に解釈する上で重要な … 続きを読む
カテゴリー: cs.CV
PMC-VQA: Visual Instruction Tuning for Medical Visual Question Answering はコメントを受け付けていません
Rethinking the Evaluation Protocol of Domain Generalization
要約 ドメインの一般化は、複数のトレーニング ドメインから学習した共通の知識を活 … 続きを読む
PopulAtion Parameter Averaging (PAPA)
要約 アンサンブル手法は複数のモデルの予測を組み合わせてパフォーマンスを向上させ … 続きを読む
Reversible Graph Neural Network-based Reaction Distribution Learning for Multiple Appropriate Facial Reactions Generation
要約 人間と人間の二者関係における顔の反応の生成は複雑であり、話者の行動には複数 … 続きを読む
ViTMatte: Boosting Image Matting with Pretrained Plain Vision Transformers
要約 最近、プレーン ビジョン トランスフォーマー (ViT) は、強力なモデリ … 続きを読む
カテゴリー: cs.CV
ViTMatte: Boosting Image Matting with Pretrained Plain Vision Transformers はコメントを受け付けていません
CLIP-Sculptor: Zero-Shot Generation of High-Fidelity and Diverse Shapes from Natural Language
要約 最近の研究では、自然言語を使用して 3D 形状を生成および編集できることが … 続きを読む
High Speed Human Action Recognition using a Photonic Reservoir Computer
要約 ビデオ内の人間の動作の認識は、コンピューター ビジョンの最も活発な研究分野 … 続きを読む
カテゴリー: cs.CV, cs.ET, physics.optics
High Speed Human Action Recognition using a Photonic Reservoir Computer はコメントを受け付けていません
Rethinking Semi-Supervised Medical Image Segmentation: A Variance-Reduction Perspective
要約 医用画像のセグメンテーションでは、意味的に類似したサンプルと異なるサンプル … 続きを読む
ZITS++: Image Inpainting by Improving the Incremental Transformer on Structural Priors
要約 画像の修復には、破損した画像の欠落領域を埋めることが含まれます。 最近目覚 … 続きを読む
カテゴリー: cs.CV
ZITS++: Image Inpainting by Improving the Incremental Transformer on Structural Priors はコメントを受け付けていません
MultiFusion: Fusing Pre-Trained Models for Multi-Lingual, Multi-Modal Image Generation
要約 テキストから画像への拡散モデル (DM) の最近の人気は、DM がユーザー … 続きを読む