cs.AI」カテゴリーアーカイブ

Development of Image Collection Method Using YOLO and Siamese Network

要約 ビッグデータの時代を迎える中、高品質なデータを収集することが非常に重要です … 続きを読む

カテゴリー: cs.AI, cs.CV | Development of Image Collection Method Using YOLO and Siamese Network はコメントを受け付けていません

Rethinking Visual Counterfactual Explanations Through Region Constraint

要約 視覚的反事実説明 (VCE) は、画像分類器の意思決定プロセスを明確にする … 続きを読む

カテゴリー: cs.AI, cs.CV | Rethinking Visual Counterfactual Explanations Through Region Constraint はコメントを受け付けていません

Exploring Model Kinship for Merging Large Language Models

要約 モデルのマージは、大規模言語モデル (LLM) の機能と効率を強化するため … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MA | Exploring Model Kinship for Merging Large Language Models はコメントを受け付けていません

Cascade learning in multi-task encoder-decoder networks for concurrent bone segmentation and glenohumeral joint assessment in shoulder CT scans

要約 変形性関節症は骨や軟骨に影響を及ぼす変性疾患であり、多くの場合、骨棘の形成 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | Cascade learning in multi-task encoder-decoder networks for concurrent bone segmentation and glenohumeral joint assessment in shoulder CT scans はコメントを受け付けていません

Cross-Modal Safety Mechanism Transfer in Large Vision-Language Models

要約 大規模視覚言語モデル (LVLM) における視覚言語の調整により、LLM … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Cross-Modal Safety Mechanism Transfer in Large Vision-Language Models はコメントを受け付けていません

Understanding Figurative Meaning through Explainable Visual Entailment

要約 大規模視覚言語モデル (VLM) は、視覚的な質問応答や視覚的な含意など、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Understanding Figurative Meaning through Explainable Visual Entailment はコメントを受け付けていません

Automatic Mapping of Anatomical Landmarks from Free-Text Using Large Language Models: Insights from Llama-2

要約 解剖学的ランドマークは、ナビゲーションや異常検出のための医療画像処理におい … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Automatic Mapping of Anatomical Landmarks from Free-Text Using Large Language Models: Insights from Llama-2 はコメントを受け付けていません

Embedding an Ethical Mind: Aligning Text-to-Image Synthesis via Lightweight Value Optimization

要約 大規模データでトレーニングされた拡散モデルの最近の進歩により、人間レベルの … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.CY, cs.LG, cs.MM | Embedding an Ethical Mind: Aligning Text-to-Image Synthesis via Lightweight Value Optimization はコメントを受け付けていません

WorldCuisines: A Massive-Scale Benchmark for Multilingual and Multicultural Visual Question Answering on Global Cuisines

要約 ビジョン言語モデル (VLM) は、特に英語以外の言語や過小評価されている … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | WorldCuisines: A Massive-Scale Benchmark for Multilingual and Multicultural Visual Question Answering on Global Cuisines はコメントを受け付けていません

SAFREE: Training-Free and Adaptive Guard for Safe Text-to-Image And Video Generation

要約 拡散モデルの最近の進歩により、高品質の画像やビデオを生成する能力が大幅に向 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | SAFREE: Training-Free and Adaptive Guard for Safe Text-to-Image And Video Generation はコメントを受け付けていません