月別アーカイブ: 2024年3月

Point-DETR3D: Leveraging Imagery Data with Spatial Point Prior for Weakly Semi-supervised 3D Object Detection

要約 高精度 3D 検出器をトレーニングするには、7 自由度の大量のラベル付き … 続きを読む

カテゴリー: cs.AI, cs.CV | Point-DETR3D: Leveraging Imagery Data with Spatial Point Prior for Weakly Semi-supervised 3D Object Detection はコメントを受け付けていません

Faster Neighborhood Attention: Reducing the O(n^2) Cost of Self Attention at the Threadblock Level

要約 近隣注目は、各トークンの注目範囲をその最も近い隣接トークンに制限することで … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Faster Neighborhood Attention: Reducing the O(n^2) Cost of Self Attention at the Threadblock Level はコメントを受け付けていません

Selectively Informative Description can Reduce Undesired Embedding Entanglements in Text-to-Image Personalization

要約 テキストから画像へのパーソナライゼーションにおいて、タイムリーかつ重大な課 … 続きを読む

カテゴリー: cs.CV | Selectively Informative Description can Reduce Undesired Embedding Entanglements in Text-to-Image Personalization はコメントを受け付けていません

Fast ODE-based Sampling for Diffusion Models in Around 5 Steps

要約 拡散モデルからのサンプリングは、可能な限り少ない関数評価 (NFE) で正 … 続きを読む

カテゴリー: cs.AI, cs.CV | Fast ODE-based Sampling for Diffusion Models in Around 5 Steps はコメントを受け付けていません

SkySense: A Multi-Modal Remote Sensing Foundation Model Towards Universal Interpretation for Earth Observation Imagery

要約 リモート センシング基盤モデル (RSFM) に関するこれまでの研究により … 続きを読む

カテゴリー: cs.CV | SkySense: A Multi-Modal Remote Sensing Foundation Model Towards Universal Interpretation for Earth Observation Imagery はコメントを受け付けていません

MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training

要約 この作業では、パフォーマンスの高いマルチモーダル大規模言語モデル (MLL … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training はコメントを受け付けていません

VideoPoet: A Large Language Model for Zero-Shot Video Generation

要約 我々は、多種多様な調整信号から、高品質のビデオと一致するオーディオを合成で … 続きを読む

カテゴリー: cs.AI, cs.CV | VideoPoet: A Large Language Model for Zero-Shot Video Generation はコメントを受け付けていません

Fully automated workflow for the design of patient-specific orthopaedic implants: application to total knee arthroplasty

要約 関節形成術は、変形性関節症の治療に一般的に行われ、痛みを軽減し、可動性を改 … 続きを読む

カテゴリー: cs.CV | Fully automated workflow for the design of patient-specific orthopaedic implants: application to total knee arthroplasty はコメントを受け付けていません

Neural Plasticity-Inspired Foundation Model for Observing the Earth Crossing Modalities

要約 基礎モデルの開発により、衛星観測データを使用して地球の表面を解釈する能力に … 続きを読む

カテゴリー: cs.CV | Neural Plasticity-Inspired Foundation Model for Observing the Earth Crossing Modalities はコメントを受け付けていません

SiMBA: Simplified Mamba-Based Architecture for Vision and Multivariate Time series

要約 トランスフォーマーは、シーケンス ミキシングにアテンション ネットワークを … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.SY, eess.IV, eess.SY | SiMBA: Simplified Mamba-Based Architecture for Vision and Multivariate Time series はコメントを受け付けていません