-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
SOAP: Enhancing Spatio-Temporal Relation and Motion Information Capturing for Few-Shot Action Recognition
要約 動作認識の高フレームレート (HFR) ビデオは、時空間関係と動作情報密度 … 続きを読む
CluMo: Cluster-based Modality Fusion Prompt for Continual Learning in Visual Question Answering
要約 大規模ビジョン言語モデル (VLM) は、さまざまなアプリケーション ドメ … 続きを読む
JieHua Paintings Style Feature Extracting Model using Stable Diffusion with ControlNet
要約 この研究は、Jiehua の文体的特徴を抽出するための新しいアプローチ、つ … 続きを読む
Open-Ended 3D Point Cloud Instance Segmentation
要約 Open-Vocab 3D インスタンス セグメンテーション手法 (OV- … 続きを読む
SBDet: A Symmetry-Breaking Object Detector via Relaxed Rotation-Equivariance
要約 Group Equivariant Convolution (GConv) … 続きを読む
Exploiting Diffusion Prior for Out-of-Distribution Detection
要約 配布外 (OOD) の検出は、特にセキュリティが重要な領域において、堅牢な … 続きを読む
Timeline and Boundary Guided Diffusion Network for Video Shadow Detection
要約 ビデオ シャドウ検出 (VSD) は、フレーム シーケンスを使用してシャド … 続きを読む
DreamFactory: Pioneering Multi-Scene Long Video Generation with a Multi-Agent Framework
要約 現在のビデオ生成モデルは、短くてリアルなクリップの作成には優れていますが、 … 続きを読む
カテゴリー: cs.AI, cs.CL, cs.CV, cs.SE, TsingHua University
DreamFactory: Pioneering Multi-Scene Long Video Generation with a Multi-Agent Framework はコメントを受け付けていません
LBC: Language-Based-Classifier for Out-Of-Variable Generalization
要約 大規模言語モデル (LLM) は、応答生成などの自然言語処理タスクで大きな … 続きを読む
V-RoAst: A New Dataset for Visual Road Assessment
要約 道路交通事故は毎年何百万人もの死者を出しており、特に低・中所得国(LMIC … 続きを読む