cs.AI」カテゴリーアーカイブ

S3PT: Scene Semantics and Structure Guided Clustering to Boost Self-Supervised Pre-Training for Autonomous Driving

要約 DINO や Cribo などの最近の自己教師ありクラスタリング ベースの … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | S3PT: Scene Semantics and Structure Guided Clustering to Boost Self-Supervised Pre-Training for Autonomous Driving はコメントを受け付けていません

One-Prompt-One-Story: Free-Lunch Consistent Text-to-Image Generation Using a Single Prompt

要約 テキストから画像の生成モデルは、入力プロンプトから高品質の画像を作成できま … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | One-Prompt-One-Story: Free-Lunch Consistent Text-to-Image Generation Using a Single Prompt はコメントを受け付けていません

REP: Resource-Efficient Prompting for Rehearsal-Free Continual Learning

要約 プロンプトに基づいてガイドされる最近のリハーサル不要の手法は、一般に、継続 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | REP: Resource-Efficient Prompting for Rehearsal-Free Continual Learning はコメントを受け付けていません

Registration of Longitudinal Liver Examinations for Tumor Progress Assessment

要約 肝臓CTスキャンの癌の進行を評価することは臨床的課題であり、同じ患者の異な … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV, physics.med-ph | Registration of Longitudinal Liver Examinations for Tumor Progress Assessment はコメントを受け付けていません

Heuristic-Free Multi-Teacher Learning

要約 Multi-Teacher学習のための新しいフレームワークであるTeach … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Heuristic-Free Multi-Teacher Learning はコメントを受け付けていません

Leveraging ChatGPT’s Multimodal Vision Capabilities to Rank Satellite Images by Poverty Level: Advancing Tools for Social Science Research

要約 この論文では、村レベルの貧困予測のために衛星画像を分析するための視覚機能を … 続きを読む

カテゴリー: cs.AI, cs.CV | Leveraging ChatGPT’s Multimodal Vision Capabilities to Rank Satellite Images by Poverty Level: Advancing Tools for Social Science Research はコメントを受け付けていません

An Interpretable X-ray Style Transfer via Trainable Local Laplacian Filter

要約 放射線科医は、診断パフォーマンスをサポートするためにニーズに手動で調整され … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | An Interpretable X-ray Style Transfer via Trainable Local Laplacian Filter はコメントを受け付けていません

ViPCap: Retrieval Text-Based Visual Prompts for Lightweight Image Captioning

要約 取得したデータを使用した最近の軽量画像キャプション モデルは、主にテキスト … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | ViPCap: Retrieval Text-Based Visual Prompts for Lightweight Image Captioning はコメントを受け付けていません

Surface Vision Mamba: Leveraging Bidirectional State Space Model for Efficient Spherical Manifold Representation

要約 注意ベースの方法は、従来の幾何学的深部学習(GDL)モデルを上回り、球状の … 続きを読む

カテゴリー: cs.AI, cs.CV | Surface Vision Mamba: Leveraging Bidirectional State Space Model for Efficient Spherical Manifold Representation はコメントを受け付けていません

Rethinking Foundation Models for Medical Image Classification through a Benchmark Study on MedMNIST

要約 基礎モデルは、下流タスクの適応性が高いため、一般化可能性があるため、医療画 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, eess.IV | Rethinking Foundation Models for Medical Image Classification through a Benchmark Study on MedMNIST はコメントを受け付けていません