-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年6月
Latent Intuitive Physics: Learning to Transfer Hidden Physics from A 3D Video
要約 単一の 3D ビデオから流体の隠れた特性を推測し、新しいシーンで観察された … 続きを読む
AITTI: Learning Adaptive Inclusive Token for Text-to-Image Generation
要約 テキストから画像への生成では高品質の結果が得られますが、生成されたコンテン … 続きを読む
カテゴリー: cs.CV
AITTI: Learning Adaptive Inclusive Token for Text-to-Image Generation はコメントを受け付けていません
Graph Neural Networks in Histopathology: Emerging Trends and Future Directions
要約 全スライド画像 (WSI) の組織病理学的分析では、深層学習手法、特に畳み … 続きを読む
Adversarial Attacks on Multimodal Agents
要約 現在、ビジョン対応言語モデル (VLM) は、実際の環境でアクションを実行 … 続きを読む
Neural Approximate Mirror Maps for Constrained Diffusion Models
要約 拡散モデルは、視覚的に説得力のある画像を作成することに優れていますが、トレ … 続きを読む
Voxel Mamba: Group-Free State Space Models for Point Cloud based 3D Object Detection
要約 Transformers に入力する前に 3D ボクセルをシリアル化して複 … 続きを読む
VIA: A Spatiotemporal Video Adaptation Framework for Global and Local Video Editing
要約 ビデオ編集は、エンターテインメントや教育からプロフェッショナルなコミュニケ … 続きを読む
GroPrompt: Efficient Grounded Prompting and Adaptation for Referring Video Object Segmentation
要約 参照ビデオ オブジェクト セグメンテーション (RVOS) は、ビデオ全体 … 続きを読む
カテゴリー: cs.CV
GroPrompt: Efficient Grounded Prompting and Adaptation for Referring Video Object Segmentation はコメントを受け付けていません
LayerMerge: Neural Network Depth Compression through Layer Pruning and Merging
要約 最近の研究では、畳み込みニューラル ネットワークの層の数を減らすと、ネット … 続きを読む
DrVideo: Document Retrieval Based Long Video Understanding
要約 長いビデオを理解するための既存の方法は、主に数十秒しか続かないビデオに焦点 … 続きを読む
カテゴリー: cs.CV
DrVideo: Document Retrieval Based Long Video Understanding はコメントを受け付けていません