月別アーカイブ: 2024年9月

Enhancing Explainability in Multimodal Large Language Models Using Ontological Context

要約 最近、マルチモーダル大規模言語モデル (MLLM) への関心が高まっていま … 続きを読む

カテゴリー: cs.CV | Enhancing Explainability in Multimodal Large Language Models Using Ontological Context はコメントを受け付けていません

High-Frequency Anti-DreamBooth: Robust Defense against Personalized Image Synthesis

要約 最近、テキストから画像への生成モデルが悪用されて、個人の不正な悪意のある画 … 続きを読む

カテゴリー: cs.CV | High-Frequency Anti-DreamBooth: Robust Defense against Personalized Image Synthesis はコメントを受け付けていません

DeRainGS: Gaussian Splatting for Enhanced Scene Reconstruction in Rainy Environments

要約 雨の悪条件下での再建は、視界の低下と視覚認識の歪みにより、重大な課題を引き … 続きを読む

カテゴリー: cs.CV | DeRainGS: Gaussian Splatting for Enhanced Scene Reconstruction in Rainy Environments はコメントを受け付けていません

Charting the Future: Using Chart Question-Answering for Scalable Evaluation of LLM-Driven Data Visualizations

要約 私たちは、Visual Question Answering (VQA) … 続きを読む

カテゴリー: cs.CL, cs.CV | Charting the Future: Using Chart Question-Answering for Scalable Evaluation of LLM-Driven Data Visualizations はコメントを受け付けていません

VideoPatchCore: An Effective Method to Memorize Normality for Video Anomaly Detection

要約 ビデオ異常検出 (VAD) は、コンピューター ビジョン内のビデオ分析と監 … 続きを読む

カテゴリー: cs.CV | VideoPatchCore: An Effective Method to Memorize Normality for Video Anomaly Detection はコメントを受け付けていません

Lego: Learning to Disentangle and Invert Personalized Concepts Beyond Object Appearance in Text-to-Image Diffusion Models

要約 Text-to-Image (T2I) モデルは、名詞、外観、スタイルなど … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | Lego: Learning to Disentangle and Invert Personalized Concepts Beyond Object Appearance in Text-to-Image Diffusion Models はコメントを受け付けていません

State-of-the-Art Periorbital Distance Prediction and Disease Classification Using Periorbital Features

要約 眼窩周囲の距離と目とまぶたの周囲の特徴には、疾患の定量化と外科的介入や医療 … 続きを読む

カテゴリー: cs.AI, cs.CV | State-of-the-Art Periorbital Distance Prediction and Disease Classification Using Periorbital Features はコメントを受け付けていません

Relighting from a Single Image: Datasets and Deep Intrinsic-based Architecture

要約 単一イメージ シーンの再ライティングは、入力イメージが新しいターゲット ラ … 続きを読む

カテゴリー: cs.CV | Relighting from a Single Image: Datasets and Deep Intrinsic-based Architecture はコメントを受け付けていません

Deep Bayesian Future Fusion for Self-Supervised, High-Resolution, Off-Road Mapping

要約 高速オフロード ナビゲーションには、ロボットが危険な障害物を回避しながらさ … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | Deep Bayesian Future Fusion for Self-Supervised, High-Resolution, Off-Road Mapping はコメントを受け付けていません

DualDn: Dual-domain Denoising via Differentiable ISP

要約 画像のノイズ除去は、カメラの画像信号処理 (ISP) パイプラインの重要な … 続きを読む

カテゴリー: cs.CV, eess.IV | DualDn: Dual-domain Denoising via Differentiable ISP はコメントを受け付けていません