月別アーカイブ: 2025年2月

Towards Generalisable Time Series Understanding Across Domains

要約 大規模なデータセットでの効率的な事前トレーニングによって駆動される自然言語 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Towards Generalisable Time Series Understanding Across Domains はコメントを受け付けていません

AliFuse: Aligning and Fusing Multi-modal Medical Data for Computer-Aided Diagnosis

要約 診断決定のために収集された医療データは通常、マルチモーダルであり、主題に関 … 続きを読む

カテゴリー: cs.CV | AliFuse: Aligning and Fusing Multi-modal Medical Data for Computer-Aided Diagnosis はコメントを受け付けていません

RaySplats: Ray Tracing based Gaussian Splatting

要約 3D Gaussian Splatting(3DGS)は、2D画像から3D … 続きを読む

カテゴリー: cs.CV | RaySplats: Ray Tracing based Gaussian Splatting はコメントを受け付けていません

Single cell resolution 3D imaging and segmentation within intact live tissues

要約 上皮細胞は、扁平上皮球体オルガノイドから密に詰め込まれた偽分散組織まで、多 … 続きを読む

カテゴリー: cs.AI, cs.CV, q-bio.CB, q-bio.QM, q-bio.TO | Single cell resolution 3D imaging and segmentation within intact live tissues はコメントを受け付けていません

RealCraft: Attention Control as A Tool for Zero-Shot Consistent Video Editing

要約 大規模なテキストから画像への生成モデルは、高品質の画像の合成において有望な … 続きを読む

カテゴリー: cs.CV | RealCraft: Attention Control as A Tool for Zero-Shot Consistent Video Editing はコメントを受け付けていません

Integrating Semi-Supervised and Active Learning for Semantic Segmentation

要約 この論文では、手動注釈のコストを削減し、モデルのパフォーマンスを向上させる … 続きを読む

カテゴリー: cs.AI, cs.CV | Integrating Semi-Supervised and Active Learning for Semantic Segmentation はコメントを受け付けていません

MTGA: Multi-View Temporal Granularity Aligned Aggregation for Event-Based Lip-Reading

要約 リップリーディングは、スピーカーの唇の動きの視覚情報を利用して、単語や文章 … 続きを読む

カテゴリー: cs.CV | MTGA: Multi-View Temporal Granularity Aligned Aggregation for Event-Based Lip-Reading はコメントを受け付けていません

LlavaGuard: An Open VLM-based Framework for Safeguarding Vision Datasets and Models

要約 このペーパーでは、大規模なデータとモデルの時代における信頼できるガードレー … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | LlavaGuard: An Open VLM-based Framework for Safeguarding Vision Datasets and Models はコメントを受け付けていません

Accelerating Diffusion Transformer via Error-Optimized Cache

要約 拡散トランス(DIT)は、コンテンツ生成に重要な方法です。 ただし、サンプ … 続きを読む

カテゴリー: cs.CV | Accelerating Diffusion Transformer via Error-Optimized Cache はコメントを受け付けていません

Inference-Time Text-to-Video Alignment with Diffusion Latent Beam Search

要約 テキストからビデオへの拡散モデルの顕著な進歩により、光エリスティックな世代 … 続きを読む

カテゴリー: cs.CV | Inference-Time Text-to-Video Alignment with Diffusion Latent Beam Search はコメントを受け付けていません