-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年3月
Semantic Layering in Room Segmentation via LLMs
要約 このペーパーでは、ラージ言語モデル (LLM) と従来の 2D マップベー … 続きを読む
Contextual AD Narration with Interleaved Multimodal Sequence
要約 オーディオ ディスクリプション (AD) タスクは、視覚障害のある人が映画 … 続きを読む
カテゴリー: cs.CV
Contextual AD Narration with Interleaved Multimodal Sequence はコメントを受け付けていません
You Only Sample Once: Taming One-Step Text-To-Image Synthesis by Self-Cooperative Diffusion GANs
要約 YOSO は、迅速かつスケーラブルで忠実度の高いワンステップ画像合成用に設 … 続きを読む
カテゴリー: cs.CV
You Only Sample Once: Taming One-Step Text-To-Image Synthesis by Self-Cooperative Diffusion GANs はコメントを受け付けていません
Best of Both Worlds: Hybrid SNN-ANN Architecture for Event-based Optical Flow Estimation
要約 ロボット工学の分野では、イベントベースのカメラが、高速モーションや高ダイナ … 続きを読む
Zero-Reference Low-Light Enhancement via Physical Quadruple Priors
要約 照明を理解し、監視の必要性を減らすことは、低照度の強調において大きな課題と … 続きを読む
カテゴリー: cs.CV
Zero-Reference Low-Light Enhancement via Physical Quadruple Priors はコメントを受け付けていません
Segment Anything for comprehensive analysis of grapevine cluster architecture and berry properties
要約 ブドウの房の構造と緻密さは、病気のかかりやすさ、果実の品質、収量に影響を与 … 続きを読む
カテゴリー: cs.CV
Segment Anything for comprehensive analysis of grapevine cluster architecture and berry properties はコメントを受け付けていません
EscherNet: A Generative Model for Scalable View Synthesis
要約 ビュー合成用のマルチビュー条件付き拡散モデルである EscherNet を … 続きを読む
カテゴリー: cs.CV
EscherNet: A Generative Model for Scalable View Synthesis はコメントを受け付けていません
DRESS: Instructing Large Vision-Language Models to Align and Interact with Humans via Natural Language Feedback
要約 我々は、大規模言語モデルからの自然言語フィードバック (NLF) を革新的 … 続きを読む
Resolution- and Stimulus-agnostic Super-Resolution of Ultra-High-Field Functional MRI: Application to Visual Studies
要約 高解像度 fMRI は、脳の中規模組織への窓を提供します。 しかし、空間解 … 続きを読む
Just Shift It: Test-Time Prototype Shifting for Zero-Shot Generalization with Vision-Language Models
要約 ビジョン言語モデル (VLM) の進歩により、特にゼロショット学習設定にお … 続きを読む