-
最近の投稿
- PhysNav-DG: A Novel Adaptive Framework for Robust VLM-Sensor Fusion in Navigation Applications
- Accelerating Diffusion Large Language Models with SlowFast Sampling: The Three Golden Principles
- IQE-CLIP: Instance-aware Query Embedding for Zero-/Few-shot Anomaly Detection in Medical Domain
- MMMG: A Massive, Multidisciplinary, Multi-Tier Generation Benchmark for Text-to-Image Reasoning
- Adaptive Discretization against an Adversary: Lipschitz bandits, Dynamic Pricing, and Auction Tuning
-
最近のコメント
表示できるコメントはありません。 cs.AI (39607) cs.CL (29982) cs.CV (44948) cs.HC (3015) cs.LG (44544) cs.RO (23690) cs.SY (3609) eess.IV (5149) eess.SY (3601) stat.ML (5788)
月別アーカイブ: 2024年8月
microYOLO: Towards Single-Shot Object Detection on Microcontrollers
要約 この進行中の論文では、YOLO を使用したマイクロコントローラーでのシング … 続きを読む
GenDDS: Generating Diverse Driving Video Scenarios with Prompt-to-Video Generative Model
要約 自動運転トレーニングには、さまざまな交通状況、気象シナリオ、道路の種類を含 … 続きを読む
Unleashing the Temporal-Spatial Reasoning Capacity of GPT for Training-Free Audio and Language Referenced Video Object Segmentation
要約 このペーパーでは、オーディオおよび言語参照ビデオ オブジェクト セグメンテ … 続きを読む
カテゴリー: cs.CV
Unleashing the Temporal-Spatial Reasoning Capacity of GPT for Training-Free Audio and Language Referenced Video Object Segmentation はコメントを受け付けていません
LLaVA-MoD: Making LLaVA Tiny via MoE Knowledge Distillation
要約 大規模な MLLM (l-MLLM) から知識を抽出することで、小規模なマ … 続きを読む
カテゴリー: cs.CV
LLaVA-MoD: Making LLaVA Tiny via MoE Knowledge Distillation はコメントを受け付けていません
SpineMamba: Enhancing 3D Spinal Segmentation in Clinical Imaging through Residual Visual Mamba Layers and Shape Priors
要約 3D 臨床医療画像の正確なセグメンテーションは、脊椎疾患の診断と治療におい … 続きを読む
Disentangled Diffusion Autoencoder for Harmonization of Multi-site Neuroimaging Data
要約 複数の部位とスキャナーからの神経画像データセットを組み合わせると、統計的検 … 続きを読む
カテゴリー: cs.CV
Disentangled Diffusion Autoencoder for Harmonization of Multi-site Neuroimaging Data はコメントを受け付けていません
Gen-Swarms: Adapting Deep Generative Models to Swarms of Drones
要約 Gen-Swarms は、ディープ生成モデルの機能を活用し、リアクティブ … 続きを読む
Infusion: internal diffusion for inpainting of dynamic textures and complex motion
要約 ビデオ修復は、視覚的に説得力のある方法でビデオ内の領域を塗りつぶすタスクで … 続きを読む
カテゴリー: cs.CV
Infusion: internal diffusion for inpainting of dynamic textures and complex motion はコメントを受け付けていません
CoRe: Context-Regularized Text Embedding Learning for Text-to-Image Personalization
要約 テキストから画像へのパーソナライゼーションの最近の進歩により、ユーザーが提 … 続きを読む
カテゴリー: cs.CV
CoRe: Context-Regularized Text Embedding Learning for Text-to-Image Personalization はコメントを受け付けていません
Leveraging Open Knowledge for Advancing Task Expertise in Large Language Models
要約 特定領域のタスクを解決するための大規模言語モデル (LLM) の専門知識を … 続きを読む