cs.LG」カテゴリーアーカイブ

VerA: Versatile Anonymization Applicable to Clinical Facial Photographs

要約 顔画像の配布におけるプライバシーの要求は、GDPR、DPDPA、CCPA、 … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.LG | VerA: Versatile Anonymization Applicable to Clinical Facial Photographs はコメントを受け付けていません

High-performance real-world optical computing trained by in situ gradient-based model-free optimization

要約 光コンピューティング システムは高速かつ低エネルギーのデータ処理を提供しま … 続きを読む

カテゴリー: cs.CV, cs.ET, cs.LG, physics.optics | High-performance real-world optical computing trained by in situ gradient-based model-free optimization はコメントを受け付けていません

Layer Pruning with Consensus: A Triple-Win Solution

要約 レイヤー プルーニングは、標準的な構造化プルーニングに代わる有望な代替手段 … 続きを読む

カテゴリー: cs.CV, cs.LG | Layer Pruning with Consensus: A Triple-Win Solution はコメントを受け付けていません

Enhancing Medical Image Segmentation with Deep Learning and Diffusion Models

要約 医用画像のセグメンテーションは正確な臨床診断に不可欠ですが、病変と正常組織 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Enhancing Medical Image Segmentation with Deep Learning and Diffusion Models はコメントを受け付けていません

Contrasting local and global modeling with machine learning and satellite data: A case study estimating tree canopy height in African savannas

要約 衛星画像を使用した機械学習 (SatML) の進歩により、地球規模での環境 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Contrasting local and global modeling with machine learning and satellite data: A case study estimating tree canopy height in African savannas はコメントを受け付けていません

Beyond Training: Dynamic Token Merging for Zero-Shot Video Understanding

要約 マルチモーダル大規模言語モデル (MLLM) の最近の進歩により、ビデオ理 … 続きを読む

カテゴリー: cs.CV, cs.LG | Beyond Training: Dynamic Token Merging for Zero-Shot Video Understanding はコメントを受け付けていません

Multimodal Autoregressive Pre-training of Large Vision Encoders

要約 大規模ビジョンエンコーダの事前トレーニングのための新しい方法を紹介します。 … 続きを読む

カテゴリー: cs.CV, cs.LG | Multimodal Autoregressive Pre-training of Large Vision Encoders はコメントを受け付けていません

Coarse Correspondences Boost Spatial-Temporal Reasoning in Multimodal Language Model

要約 マルチモーダル言語モデル (MLLM) は現実世界の環境でますます適用され … 続きを読む

カテゴリー: cs.CV, cs.LG | Coarse Correspondences Boost Spatial-Temporal Reasoning in Multimodal Language Model はコメントを受け付けていません

Stable Flow: Vital Layers for Training-Free Image Editing

要約 拡散モデルは、コンテンツの合成と編集の分野に革命をもたらしました。 最近の … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.LG | Stable Flow: Vital Layers for Training-Free Image Editing はコメントを受け付けていません

LLMSteer: Improving Long-Context LLM Inference by Steering Attention on Reused Contexts

要約 大規模言語モデル (LLM) は複雑なタスクで優れたパフォーマンスを示しま … 続きを読む

カテゴリー: cs.CL, cs.LG | LLMSteer: Improving Long-Context LLM Inference by Steering Attention on Reused Contexts はコメントを受け付けていません