月別アーカイブ: 2024年3月

Semantic Layering in Room Segmentation via LLMs

要約 このペーパーでは、ラージ言語モデル (LLM) と従来の 2D マップベー … 続きを読む

カテゴリー: cs.CV, cs.RO | Semantic Layering in Room Segmentation via LLMs はコメントを受け付けていません

Contextual AD Narration with Interleaved Multimodal Sequence

要約 オーディオ ディスクリプション (AD) タスクは、視覚障害のある人が映画 … 続きを読む

カテゴリー: cs.CV | Contextual AD Narration with Interleaved Multimodal Sequence はコメントを受け付けていません

You Only Sample Once: Taming One-Step Text-To-Image Synthesis by Self-Cooperative Diffusion GANs

要約 YOSO は、迅速かつスケーラブルで忠実度の高いワンステップ画像合成用に設 … 続きを読む

カテゴリー: cs.CV | You Only Sample Once: Taming One-Step Text-To-Image Synthesis by Self-Cooperative Diffusion GANs はコメントを受け付けていません

Best of Both Worlds: Hybrid SNN-ANN Architecture for Event-based Optical Flow Estimation

要約 ロボット工学の分野では、イベントベースのカメラが、高速モーションや高ダイナ … 続きを読む

カテゴリー: cs.CV, cs.LG | Best of Both Worlds: Hybrid SNN-ANN Architecture for Event-based Optical Flow Estimation はコメントを受け付けていません

Zero-Reference Low-Light Enhancement via Physical Quadruple Priors

要約 照明を理解し、監視の必要性を減らすことは、低照度の強調において大きな課題と … 続きを読む

カテゴリー: cs.CV | Zero-Reference Low-Light Enhancement via Physical Quadruple Priors はコメントを受け付けていません

Segment Anything for comprehensive analysis of grapevine cluster architecture and berry properties

要約 ブドウの房の構造と緻密さは、病気のかかりやすさ、果実の品質、収量に影響を与 … 続きを読む

カテゴリー: cs.CV | Segment Anything for comprehensive analysis of grapevine cluster architecture and berry properties はコメントを受け付けていません

EscherNet: A Generative Model for Scalable View Synthesis

要約 ビュー合成用のマルチビュー条件付き拡散モデルである EscherNet を … 続きを読む

カテゴリー: cs.CV | EscherNet: A Generative Model for Scalable View Synthesis はコメントを受け付けていません

DRESS: Instructing Large Vision-Language Models to Align and Interact with Humans via Natural Language Feedback

要約 我々は、大規模言語モデルからの自然言語フィードバック (NLF) を革新的 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | DRESS: Instructing Large Vision-Language Models to Align and Interact with Humans via Natural Language Feedback はコメントを受け付けていません

Resolution- and Stimulus-agnostic Super-Resolution of Ultra-High-Field Functional MRI: Application to Visual Studies

要約 高解像度 fMRI は、脳の中規模組織への窓を提供します。 しかし、空間解 … 続きを読む

カテゴリー: cs.CV, eess.IV | Resolution- and Stimulus-agnostic Super-Resolution of Ultra-High-Field Functional MRI: Application to Visual Studies はコメントを受け付けていません

Just Shift It: Test-Time Prototype Shifting for Zero-Shot Generalization with Vision-Language Models

要約 ビジョン言語モデル (VLM) の進歩により、特にゼロショット学習設定にお … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Just Shift It: Test-Time Prototype Shifting for Zero-Shot Generalization with Vision-Language Models はコメントを受け付けていません