cs.AI」カテゴリーアーカイブ

Robust Watermarking Using Generative Priors Against Image Editing: From Benchmarking to Advances

要約 現在の画像透かし挿入方法は、大規模なテキストから画像へのモデルによって可能 … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.CV | Robust Watermarking Using Generative Priors Against Image Editing: From Benchmarking to Advances はコメントを受け付けていません

Towards Visual Text Design Transfer Across Languages

要約 ビジュアル テキスト デザインは、映画のポスターやアルバム カバーなどのマ … 続きを読む

カテゴリー: cs.AI, cs.CV | Towards Visual Text Design Transfer Across Languages はコメントを受け付けていません

Ensemble architecture in polyp segmentation

要約 この研究では、セマンティック セグメンテーションのアーキテクチャを再考し、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Ensemble architecture in polyp segmentation はコメントを受け付けていません

ONCOPILOT: A Promptable CT Foundation Model For Solid Tumor Evaluation

要約 発がんはタンパク質現象であり、腫瘍がさまざまな場所に発生し、複雑で多様な形 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | ONCOPILOT: A Promptable CT Foundation Model For Solid Tumor Evaluation はコメントを受け付けていません

RClicks: Realistic Click Simulation for Benchmarking Interactive Segmentation

要約 Segment Anything (SAM) の出現により、特に画像編集タ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.HC, I.4.6 | RClicks: Realistic Click Simulation for Benchmarking Interactive Segmentation はコメントを受け付けていません

Diff-Instruct++: Training One-step Text-to-image Generator Model to Align with Human Preferences

要約 ワンステップのテキストから画像への生成モデルには、迅速な推論効率、柔軟なア … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Diff-Instruct++: Training One-step Text-to-image Generator Model to Align with Human Preferences はコメントを受け付けていません

SkillMimicGen: Automated Demonstration Generation for Efficient Skill Learning and Deployment

要約 人間のデモンストレーションからの模倣学習はロボット操作の効果的なパラダイム … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | SkillMimicGen: Automated Demonstration Generation for Efficient Skill Learning and Deployment はコメントを受け付けていません

SegLLM: Multi-round Reasoning Segmentation

要約 我々は、視覚的出力とテキスト出力の両方の会話記憶を利用することによってLL … 続きを読む

カテゴリー: cs.AI, cs.CV | SegLLM: Multi-round Reasoning Segmentation はコメントを受け付けていません

ANAVI: Audio Noise Awareness using Visuals of Indoor environments for NAVIgation

要約 私たちは、より静かなロボットの経路計画のためのナビゲーションに屋内のビジュ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | ANAVI: Audio Noise Awareness using Visuals of Indoor environments for NAVIgation はコメントを受け付けていません

Unearthing Skill-Level Insights for Understanding Trade-Offs of Foundation Models

要約 モデルが強化されるにつれて、評価はより複雑になり、1 つのベンチマークで、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Unearthing Skill-Level Insights for Understanding Trade-Offs of Foundation Models はコメントを受け付けていません