-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
GEXIA: Granularity Expansion and Iterative Approximation for Scalable Multi-grained Video-language Learning
要約 さまざまなビデオ言語学習タスクにおいて、マルチグレイン データを使用してク … 続きを読む
カテゴリー: cs.CV
GEXIA: Granularity Expansion and Iterative Approximation for Scalable Multi-grained Video-language Learning はコメントを受け付けていません
Why Fine-grained Labels in Pretraining Benefit Generalization?
要約 最近の研究では、きめの細かいラベル付けされたデータを使用してディープ ニュ … 続きを読む
ACDiT: Interpolating Autoregressive Conditional Modeling and Diffusion Transformer
要約 最近、包括的なマルチモーダル モデルへの関心が高まっているため、多様なモダ … 続きを読む
カテゴリー: cs.CV
ACDiT: Interpolating Autoregressive Conditional Modeling and Diffusion Transformer はコメントを受け付けていません
ObjCtrl-2.5D: Training-free Object Control with Camera Poses
要約 この研究は、画像からビデオ (I2V) 生成において、より正確で多用途なオ … 続きを読む
カテゴリー: cs.CV
ObjCtrl-2.5D: Training-free Object Control with Camera Poses はコメントを受け付けていません
MoRAG — Multi-Fusion Retrieval Augmented Generation for Human Motion
要約 テキストベースの人間のモーション生成のための、新しいマルチパート融合ベース … 続きを読む
STIV: Scalable Text and Image Conditioned Video Generation
要約 ビデオ生成の分野は目覚ましい進歩を遂げていますが、堅牢でスケーラブルなモデ … 続きを読む
SKIPNet: Spatial Attention Skip Connections for Enhanced Brain Tumor Classification
要約 タイムリーな治療には磁気共鳴画像法(MRI)による脳腫瘍の早期発見が不可欠 … 続きを読む
GASP: Gaussian Avatars with Synthetic Priors
要約 ガウス スプラッティングは、リアルタイムの写真のようにリアルなレンダリング … 続きを読む
Image Retrieval with Intra-Sweep Representation Learning for Neck Ultrasound Scanning Guidance
要約 目的: 術中超音波 (US) は、経口ロボット手術におけるリアルタイムの視 … 続きを読む
カテゴリー: cs.CV
Image Retrieval with Intra-Sweep Representation Learning for Neck Ultrasound Scanning Guidance はコメントを受け付けていません
M3TR: Generalist HD Map Construction with Variable Map Priors
要約 自動運転車の走行には、通常は HD マップの形式で道路情報が必要です。 オ … 続きを読む