-
最近の投稿
- Enhancing Heterogeneous Multi-Agent Cooperation in Decentralized MARL via GNN-driven Intrinsic Rewards
- OrbitGrasp: $SE(3)$-Equivariant Grasp Learning
- M3Bench: Benchmarking Whole-body Motion Generation for Mobile Manipulation in 3D Scenes
- Self-Supervised Learning For Robust Robotic Grasping In Dynamic Environment
- Routing and Scheduling Optimization for Urban Air Mobility Fleet Management using Quantum Annealing
-
最近のコメント
表示できるコメントはありません。 cs.AI (28126) cs.CL (21249) cs.CR (2197) cs.CV (34799) cs.LG (32858) cs.RO (16174) cs.SY (2496) eess.IV (4244) eess.SY (2490) stat.ML (4401)
月別アーカイブ: 2024年6月
Latent Intuitive Physics: Learning to Transfer Hidden Physics from A 3D Video
要約 単一の 3D ビデオから流体の隠れた特性を推測し、新しいシーンで観察された … 続きを読む
AITTI: Learning Adaptive Inclusive Token for Text-to-Image Generation
要約 テキストから画像への生成では高品質の結果が得られますが、生成されたコンテン … 続きを読む
カテゴリー: cs.CV
AITTI: Learning Adaptive Inclusive Token for Text-to-Image Generation はコメントを受け付けていません
Graph Neural Networks in Histopathology: Emerging Trends and Future Directions
要約 全スライド画像 (WSI) の組織病理学的分析では、深層学習手法、特に畳み … 続きを読む
Adversarial Attacks on Multimodal Agents
要約 現在、ビジョン対応言語モデル (VLM) は、実際の環境でアクションを実行 … 続きを読む
Neural Approximate Mirror Maps for Constrained Diffusion Models
要約 拡散モデルは、視覚的に説得力のある画像を作成することに優れていますが、トレ … 続きを読む
Voxel Mamba: Group-Free State Space Models for Point Cloud based 3D Object Detection
要約 Transformers に入力する前に 3D ボクセルをシリアル化して複 … 続きを読む
VIA: A Spatiotemporal Video Adaptation Framework for Global and Local Video Editing
要約 ビデオ編集は、エンターテインメントや教育からプロフェッショナルなコミュニケ … 続きを読む
GroPrompt: Efficient Grounded Prompting and Adaptation for Referring Video Object Segmentation
要約 参照ビデオ オブジェクト セグメンテーション (RVOS) は、ビデオ全体 … 続きを読む
カテゴリー: cs.CV
GroPrompt: Efficient Grounded Prompting and Adaptation for Referring Video Object Segmentation はコメントを受け付けていません
LayerMerge: Neural Network Depth Compression through Layer Pruning and Merging
要約 最近の研究では、畳み込みニューラル ネットワークの層の数を減らすと、ネット … 続きを読む
DrVideo: Document Retrieval Based Long Video Understanding
要約 長いビデオを理解するための既存の方法は、主に数十秒しか続かないビデオに焦点 … 続きを読む
カテゴリー: cs.CV
DrVideo: Document Retrieval Based Long Video Understanding はコメントを受け付けていません