「cs.AI」カテゴリーアーカイブ

Robust Watermarking Using Generative Priors Against Image Editing: From Benchmarking to Advances

投稿日: 2024年10月25日作成者: jarxiv

要約現在の画像透かし挿入方法は、大規模なテキストから画像へのモデルによって可能 … 続きを読む →

カテゴリー: cs.AI, cs.CR, cs.CV | コメントを受け付けていません

Towards Visual Text Design Transfer Across Languages

投稿日: 2024年10月25日作成者: jarxiv

要約ビジュアルテキストデザインは、映画のポスターやアルバムカバーなどのマ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Ensemble architecture in polyp segmentation

投稿日: 2024年10月25日作成者: jarxiv

要約この研究では、セマンティックセグメンテーションのアーキテクチャを再考し、 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

ONCOPILOT: A Promptable CT Foundation Model For Solid Tumor Evaluation

投稿日: 2024年10月25日作成者: jarxiv

要約発がんはタンパク質現象であり、腫瘍がさまざまな場所に発生し、複雑で多様な形 … 続きを読む →

カテゴリー: cs.AI, cs.CV, eess.IV | コメントを受け付けていません

RClicks: Realistic Click Simulation for Benchmarking Interactive Segmentation

投稿日: 2024年10月25日作成者: jarxiv

要約 Segment Anything (SAM) の出現により、特に画像編集タ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.HC, I.4.6 | コメントを受け付けていません

Diff-Instruct++: Training One-step Text-to-image Generator Model to Align with Human Preferences

投稿日: 2024年10月25日作成者: jarxiv

要約ワンステップのテキストから画像への生成モデルには、迅速な推論効率、柔軟なア … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

SkillMimicGen: Automated Demonstration Generation for Efficient Skill Learning and Deployment

投稿日: 2024年10月25日作成者: jarxiv

要約人間のデモンストレーションからの模倣学習はロボット操作の効果的なパラダイム … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

SegLLM: Multi-round Reasoning Segmentation

投稿日: 2024年10月25日作成者: jarxiv

要約我々は、視覚的出力とテキスト出力の両方の会話記憶を利用することによってLL … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

ANAVI: Audio Noise Awareness using Visuals of Indoor environments for NAVIgation

投稿日: 2024年10月25日作成者: jarxiv

要約私たちは、より静かなロボットの経路計画のためのナビゲーションに屋内のビジュ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

Unearthing Skill-Level Insights for Understanding Trade-Offs of Foundation Models

投稿日: 2024年10月25日作成者: jarxiv

要約モデルが強化されるにつれて、評価はより複雑になり、1 つのベンチマークで、 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

Robust Watermarking Using Generative Priors Against Image Editing: From Benchmarking to Advances

Towards Visual Text Design Transfer Across Languages

Ensemble architecture in polyp segmentation

ONCOPILOT: A Promptable CT Foundation Model For Solid Tumor Evaluation

RClicks: Realistic Click Simulation for Benchmarking Interactive Segmentation

Diff-Instruct++: Training One-step Text-to-image Generator Model to Align with Human Preferences

SkillMimicGen: Automated Demonstration Generation for Efficient Skill Learning and Deployment

SegLLM: Multi-round Reasoning Segmentation

ANAVI: Audio Noise Awareness using Visuals of Indoor environments for NAVIgation

Unearthing Skill-Level Insights for Understanding Trade-Offs of Foundation Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー