月別アーカイブ: 2024年1月

Proactive Detection of Voice Cloning with Localized Watermarking

要約 急速に進化している音声生成モデルの分野では、音声複製のリスクに対して音声の … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.SD | Proactive Detection of Voice Cloning with Localized Watermarking はコメントを受け付けていません

Weaver: Foundation Models for Creative Writing

要約 この作品では、コンテンツ作成専用の大規模言語モデル (LLM) の最初のフ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Weaver: Foundation Models for Creative Writing はコメントを受け付けていません

Consistency Enhancement-Based Deep Multiview Clustering via Contrastive Learning

要約 マルチビュー クラスタリング (MVC) は、複数のビューにわたる情報を合 … 続きを読む

カテゴリー: cs.CV, cs.LG | Consistency Enhancement-Based Deep Multiview Clustering via Contrastive Learning はコメントを受け付けていません

Segmentation and Characterization of Macerated Fibers and Vessels Using Deep Learning

要約 目的: 木材は繊維や血管などのさまざまな種類の細胞で構成されており、それが … 続きを読む

カテゴリー: cs.CV, cs.LG, I.5.1 | Segmentation and Characterization of Macerated Fibers and Vessels Using Deep Learning はコメントを受け付けていません

GroundingGPT:Language Enhanced Multi-modal Grounding Model

要約 マルチモーダル大規模言語モデルは、さまざまなモダリティのさまざまなタスクに … 続きを読む

カテゴリー: cs.CL, cs.CV | GroundingGPT:Language Enhanced Multi-modal Grounding Model はコメントを受け付けていません

LYT-Net: Lightweight YUV Transformer-based Network for Low-Light Image Enhancement

要約 近年、深層学習ベースのソリューションが画像強化の分野で成功を収めていること … 続きを読む

カテゴリー: cs.CV, eess.IV | LYT-Net: Lightweight YUV Transformer-based Network for Low-Light Image Enhancement はコメントを受け付けていません

CoSSegGaussians: Compact and Swift Scene Segmenting 3D Gaussians with Dual Feature Fusion

要約 我々は、RGB画像のみを入力して、高速なレンダリング速度でコンパクトな3D … 続きを読む

カテゴリー: cs.AI, cs.CV | CoSSegGaussians: Compact and Swift Scene Segmenting 3D Gaussians with Dual Feature Fusion はコメントを受け付けていません

MILD: Modeling the Instance Learning Dynamics for Learning with Noisy Labels

要約 ディープラーニングは大きな成功を収めていますが、多くの場合、正確なラベルが … 続きを読む

カテゴリー: cs.CV, cs.LG | MILD: Modeling the Instance Learning Dynamics for Learning with Noisy Labels はコメントを受け付けていません

Deep 3D World Models for Multi-Image Super-Resolution Beyond Optical Flow

要約 マルチ画像超解像度 (MISR) を使用すると、シーン サンプリングのサブ … 続きを読む

カテゴリー: cs.CV, eess.IV | Deep 3D World Models for Multi-Image Super-Resolution Beyond Optical Flow はコメントを受け付けていません

Divide and Conquer: Language Models can Plan and Self-Correct for Compositional Text-to-Image Generation

要約 高品質の画像を生成するためのテキストから画像へのモデルは大幅に進歩しました … 続きを読む

カテゴリー: cs.CV | Divide and Conquer: Language Models can Plan and Self-Correct for Compositional Text-to-Image Generation はコメントを受け付けていません