-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Improving Autoregressive Training with Dynamic Oracles
要約 NLP 内の多くのタスクは、シーケンスのタグ付けからテキスト生成に至るまで … 続きを読む
Vertical LoRA: Dense Expectation-Maximization Interpretation of Transformers
要約 この論文では、トランスフォーマーをベイジアン ネット上で実行される高密度期 … 続きを読む
RadarOcc: Robust 3D Occupancy Prediction with 4D Imaging Radar
要約 3D 占有ベースの認識パイプラインは、詳細なシーンの説明をキャプチャし、さ … 続きを読む
PianoMotion10M: Dataset and Benchmark for Hand Motion Generation in Piano Performance
要約 近年、教育における人工知能技術への注目が高まっていますが、効果的な楽器指導 … 続きを読む
Exploring the Spectrum of Visio-Linguistic Compositionality and Recognition
要約 CLIP などの視覚および言語モデル (VLM) は、驚くべきゼロショット … 続きを読む
Aligning Vision Models with Human Aesthetics in Retrieval: Benchmarks and Algorithms
要約 最新の視覚モデルは、非常に大規模なノイズの多いデータセットでトレーニングさ … 続きを読む
Instruct 4D-to-4D: Editing 4D Scenes as Pseudo-3D Scenes Using 2D Diffusion
要約 この論文では、2D 拡散モデルの 4D 認識と時空間的一貫性を実現し、高品 … 続きを読む
MMScan: A Multi-Modal 3D Scene Dataset with Hierarchical Grounded Language Annotations
要約 LLM の出現と他のデータ モダリティとの統合により、物理世界との接続性に … 続きを読む
ConsistDreamer: 3D-Consistent 2D Diffusion for High-Fidelity Scene Editing
要約 この論文では、3D 認識と 3D 一貫性を備えた 2D 拡散モデルを強化す … 続きを読む
4M-21: An Any-to-Any Vision Model for Tens of Tasks and Modalities
要約 4M や UnifiedIO などの現在のマルチモーダルおよびマルチタスク … 続きを読む