-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Reanimating Images using Neural Representations of Dynamic Stimuli
要約 コンピュータービジョンモデルは静的な画像認識で信じられないほどの進歩を遂げ … 続きを読む
Structuring Scientific Innovation: A Framework for Modeling and Discovering Impactful Knowledge Combinations
要約 大規模な言語モデルの出現は、科学的知識の構造化された探求のための新しい可能 … 続きを読む
カテゴリー: cs.AI
Structuring Scientific Innovation: A Framework for Modeling and Discovering Impactful Knowledge Combinations はコメントを受け付けていません
MC-LLaVA: Multi-Concept Personalized Vision-Language Model
要約 現在のビジョン言語モデル(VLM)は、視覚的な質問応答など、さまざまなタス … 続きを読む
Aether: Geometric-Aware Unified World Modeling
要約 幾何学的再構築と生成モデリングの統合は、人間のような空間的推論が可能なAI … 続きを読む
Any6D: Model-free 6D Pose Estimation of Novel Objects
要約 6Dオブジェクトポーズ推定のモデルフリーフレームワークであるAny6Dを紹 … 続きを読む
Lightweight Embedded FPGA Deployment of Learned Image Compression with Knowledge Distillation and Hybrid Quantization
要約 学習可能な画像圧縮(LIC)は、RD効率で標準化されたビデオコーデックを上 … 続きを読む
Commander-GPT: Fully Unleashing the Sarcasm Detection Capability of Multi-Modal Large Language Models
要約 自然言語処理の分野(NLP)の重要な研究方向としての皮肉検出は、広範囲にわ … 続きを読む
Frequency Dynamic Convolution for Dense Image Prediction
要約 動的畳み込み(DY-CONV)は、注意メカニズムと組み合わせた複数の並列重 … 続きを読む
Latent Embedding Adaptation for Human Preference Alignment in Diffusion Planners
要約 この作業は、個々のユーザーの好みに迅速に適応できるリソース効率の良いアプロ … 続きを読む
Humanoid Policy ~ Human Policy
要約 さまざまなデータを使用したヒューマノイドロボットのトレーニング操作ポリシー … 続きを読む