-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Conformal Predictions for Human Action Recognition with Vision-Language Models
要約 Human-in-the-Loop(HITL)フレームワークは、多くの現実 … 続きを読む
Few-Shot Classification and Anatomical Localization of Tissues in SPECT Imaging
要約 正確な分類と解剖学的局在は、効果的な医療診断と研究に不可欠であり、深い学習 … 続きを読む
Do generative video models learn physical principles from watching videos?
要約 AIビデオ生成は革命を起こしており、品質とリアリズムが急速に進歩しています … 続きを読む
CHIRLA: Comprehensive High-resolution Identification and Re-identification for Large-scale Analysis
要約 人の再識別(REID)は、コンピュータービジョンの重要な課題であり、さまざ … 続きを読む
GHOST: Gaussian Hypothesis Open-Set Technique
要約 大規模な認識方法の評価は、通常、全体的なパフォーマンスに焦点を当てています … 続きを読む
CleanUMamba: A Compact Mamba Network for Speech Denoising using Channel Pruning
要約 このペーパーでは、生の波形に直接適用されるリアルタイムの因果オーディオ除去 … 続きを読む
DPD-NeuralEngine: A 22-nm 6.6-TOPS/W/mm$^2$ Recurrent Neural Network Accelerator for Wideband Power Amplifier Digital Pre-Distortion
要約 最新の通信システムにおけるDeep Neural Network(DNN) … 続きを読む
Grounding Text-to-Image Diffusion Models for Controlled High-Quality Image Generation
要約 テキストからイメージ(T2I)生成拡散モデルは、テキストキャプションから多 … 続きを読む
Guided and Variance-Corrected Fusion with One-shot Style Alignment for Large-Content Image Generation
要約 小さな拡散モデルを使用して大きな画像を生成すると、大規模なモデルのトレーニ … 続きを読む
KARST: Multi-Kernel Kronecker Adaptation with Re-Scaling Transmission for Visual Classification
要約 特定のタスクの事前訓練を受けたビジョンモデルを微調整することは、コンピュー … 続きを読む