月別アーカイブ: 2024年8月

Efficient Slice Anomaly Detection Network for 3D Brain MRI Volume

要約 現在の異常検出方法は、ベンチマークとなる産業データでは優れていますが、「正 … 続きを読む

カテゴリー: cs.CV, cs.LG | Efficient Slice Anomaly Detection Network for 3D Brain MRI Volume はコメントを受け付けていません

More Text, Less Point: Towards 3D Data-Efficient Point-Language Understanding

要約 大規模言語モデル (LLM) で 3D 物理世界を理解できるようにすること … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | More Text, Less Point: Towards 3D Data-Efficient Point-Language Understanding はコメントを受け付けていません

Distribution Backtracking Builds A Faster Convergence Trajectory for One-step Diffusion Distillation

要約 拡散モデルのサンプリング速度を高速化することは依然として大きな課題です。 … 続きを読む

カテゴリー: cs.CV | Distribution Backtracking Builds A Faster Convergence Trajectory for One-step Diffusion Distillation はコメントを受け付けていません

CoGen: Learning from Feedback with Coupled Comprehension and Generation

要約 言語理解機能と言語生成機能の両方を備えたシステムは、この 2 つの間の緊密 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | CoGen: Learning from Feedback with Coupled Comprehension and Generation はコメントを受け付けていません

ClimDetect: A Benchmark Dataset for Climate Change Detection and Attribution

要約 気候変動による気温上昇を検出し、その原因を特定することは、地球温暖化を理解 … 続きを読む

カテゴリー: cs.CV, cs.LG, physics.ao-ph | ClimDetect: A Benchmark Dataset for Climate Change Detection and Attribution はコメントを受け付けていません

Perceive-IR: Learning to Perceive Degradation Better for All-in-One Image Restoration

要約 特定の劣化に対するタスク固有および一般的な画像復元方法には限界があるため、 … 続きを読む

カテゴリー: cs.CV | Perceive-IR: Learning to Perceive Degradation Better for All-in-One Image Restoration はコメントを受け付けていません

TEDRA: Text-based Editing of Dynamic and Photoreal Actors

要約 過去数年にわたり、実際の人間のビデオのみからフォトリアリスティックで運転可 … 続きを読む

カテゴリー: cs.CV | TEDRA: Text-based Editing of Dynamic and Photoreal Actors はコメントを受け付けていません

Spatio-Temporal Context Prompting for Zero-Shot Action Detection

要約 時空間アクションの検出には、ビデオ内の個々のアクションの位置を特定し、分類 … 続きを読む

カテゴリー: cs.AI, cs.CV | Spatio-Temporal Context Prompting for Zero-Shot Action Detection はコメントを受け付けていません

Eagle: Exploring The Design Space for Multimodal LLMs with Mixture of Encoders

要約 複雑な視覚情報を正確に解釈する機能は、マルチモーダル大規模言語モデル (M … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Eagle: Exploring The Design Space for Multimodal LLMs with Mixture of Encoders はコメントを受け付けていません

Domain-decoupled Physics-informed Neural Networks with Closed-form Gradients for Fast Model Learning of Dynamical Systems

要約 物理情報に基づいたニューラル ネットワーク (PINN) は、物理方程式を … 続きを読む

カテゴリー: cs.LG, cs.RO, cs.SY, eess.SY | Domain-decoupled Physics-informed Neural Networks with Closed-form Gradients for Fast Model Learning of Dynamical Systems はコメントを受け付けていません