-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年8月
MMTrail: A Multimodal Trailer Video Dataset with Language and Music Descriptions
要約 大規模なマルチモダリティ データセットは、大規模なビデオ言語モデルの成功を … 続きを読む
EMO: Emote Portrait Alive — Generating Expressive Portrait Videos with Audio2Video Diffusion Model under Weak Conditions
要約 この研究では、オーディオ キューと顔の動きの間の動的かつ微妙な関係に焦点を … 続きを読む
カテゴリー: cs.CV
EMO: Emote Portrait Alive — Generating Expressive Portrait Videos with Audio2Video Diffusion Model under Weak Conditions はコメントを受け付けていません
SuperSimpleNet: Unifying Unsupervised and Supervised Learning for Fast and Reliable Surface Defect Detection
要約 表面欠陥検出の目的は、捕捉した物体の表面上の異常な領域を特定して位置を特定 … 続きを読む
カテゴリー: cs.CV
SuperSimpleNet: Unifying Unsupervised and Supervised Learning for Fast and Reliable Surface Defect Detection はコメントを受け付けていません
Leveraging Entity Information for Cross-Modality Correlation Learning: The Entity-Guided Multimodal Summarization
要約 マルチメディア データの急速な増加により、テキストと関連画像の両方を統合し … 続きを読む
When a Relation Tells More Than a Concept: Exploring and Evaluating Classifier Decisions with CoReX
要約 入力ピクセルの関連性に基づく畳み込みニューラル ネットワーク (CNN) … 続きを読む
DiffX: Guide Your Layout to Cross-Modal Generative Modeling
要約 拡散モデルは、言語主導およびレイアウト主導の画像生成において大きな進歩を遂 … 続きを読む
カテゴリー: cs.CV
DiffX: Guide Your Layout to Cross-Modal Generative Modeling はコメントを受け付けていません
Iterative CT Reconstruction via Latent Variable Optimization of Shallow Diffusion Models
要約 画像生成AIは近年大きな注目を集めています。 特に、最近の生成AIの中核を … 続きを読む
カテゴリー: cs.CV, cs.LG, physics.med-ph
Iterative CT Reconstruction via Latent Variable Optimization of Shallow Diffusion Models はコメントを受け付けていません
Dilated Convolution with Learnable Spacings makes visual models more aligned with humans: a Grad-CAM study
要約 Dirated Convolution with Learningable … 続きを読む
IMAGDressing-v1: Customizable Virtual Dressing
要約 最新の進歩により、潜在拡散モデルを使用したローカライズされた衣類修復を通じ … 続きを読む
カテゴリー: cs.CV
IMAGDressing-v1: Customizable Virtual Dressing はコメントを受け付けていません
SimEndoGS: Efficient Data-driven Scene Simulation using Robotic Surgery Videos via Physics-embedded 3D Gaussians
要約 手術シーンのシミュレーションは、外科教育やシミュレーターベースのロボット学 … 続きを読む