月別アーカイブ: 2025年3月

Going Beyond Conventional OOD Detection

要約 外部分布(OOD)検出は、重要なアプリケーションでの深い学習モデルの安全な … 続きを読む

カテゴリー: cs.CV, cs.LG | Going Beyond Conventional OOD Detection はコメントを受け付けていません

Birds look like cars: Adversarial analysis of intrinsically interpretable deep learning

要約 一般的な信念は、本質的に解釈可能な深い学習モデルが、彼らの行動を正しく直感 … 続きを読む

カテゴリー: cs.CV, cs.LG | Birds look like cars: Adversarial analysis of intrinsically interpretable deep learning はコメントを受け付けていません

GBlobs: Explicit Local Structure via Gaussian Blobs for Improved Cross-Domain LiDAR-based 3D Object Detection

要約 LIDARベースの3D検出器には、トレーニングのために大きなデータセットが … 続きを読む

カテゴリー: cs.CV | GBlobs: Explicit Local Structure via Gaussian Blobs for Improved Cross-Domain LiDAR-based 3D Object Detection はコメントを受け付けていません

Visual Haystacks: A Vision-Centric Needle-In-A-Haystack Benchmark

要約 大規模なマルチモーダルモデル(LMM)は、単一の画像に対して視覚的な質問を … 続きを読む

カテゴリー: cs.CV | Visual Haystacks: A Vision-Centric Needle-In-A-Haystack Benchmark はコメントを受け付けていません

Rethinking Diffusion Model in High Dimension

要約 次元の呪いは、統計的確率モデルでは避けられない課題ですが、拡散モデルはこの … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, stat.ML | Rethinking Diffusion Model in High Dimension はコメントを受け付けていません

MF-VITON: High-Fidelity Mask-Free Virtual Try-On with Minimal Input

要約 Virtual Try-On(VITON)の最近の進歩により、強力なテキス … 続きを読む

カテゴリー: cs.CV | MF-VITON: High-Fidelity Mask-Free Virtual Try-On with Minimal Input はコメントを受け付けていません

TED-VITON: Transformer-Empowered Diffusion Models for Virtual Try-On

要約 Virtual Try-On(VTO)の最近の進歩は、現実的な画像を生成し … 続きを読む

カテゴリー: cs.CV | TED-VITON: Transformer-Empowered Diffusion Models for Virtual Try-On はコメントを受け付けていません

Task-Oriented Co-Design of Communication, Computing, and Control for Edge-Enabled Industrial Cyber-Physical Systems

要約 このペーパーでは、ミッションクリティカルな産業サイバー物理システム(CPS … 続きを読む

カテゴリー: cs.CV, cs.IT, eess.IV, math.IT | Task-Oriented Co-Design of Communication, Computing, and Control for Edge-Enabled Industrial Cyber-Physical Systems はコメントを受け付けていません

Generating Robot Constitutions & Benchmarks for Semantic Safety

要約 最近まで、ロボットの安全研究は、主に衝突回避とロボットのすぐ近くの危険の減 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.CY, cs.HC, cs.RO | Generating Robot Constitutions & Benchmarks for Semantic Safety はコメントを受け付けていません

MEAT: Multiview Diffusion Model for Human Generation on Megapixels with Mesh Attention

要約 マルチビュー拡散モデルは、一般的なオブジェクトの画像から3Dの生成でかなり … 続きを読む

カテゴリー: cs.AI, cs.CV | MEAT: Multiview Diffusion Model for Human Generation on Megapixels with Mesh Attention はコメントを受け付けていません