投稿者「jarxiv」のアーカイブ

Probing and Inducing Combinational Creativity in Vision-Language Models

要約 既存の概念を斬新なアイデアに組み合わせる能力は、人間の知性の基本的な特徴と … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | コメントする

GaussTrap: Stealthy Poisoning Attacks on 3D Gaussian Splatting for Targeted Scene Confusion

要約 3Dガウスの飛び散(3DG)がシーン表現と新しいビューの合成のブレークスル … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

CMT: A Cascade MAR with Topology Predictor for Multimodal Conditional CAD Generation

要約 正確でユーザーフレンドリーなコンピューター支援設計(CAD)は、工業デザイ … 続きを読む

カテゴリー: cs.CV | コメントする

RadSAM: Segmenting 3D radiological images with a 2D promptable model

要約 医療画像セグメンテーションは、臨床ケアにおける重要で時間のかかるタスクであ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | コメントする

FedMVP: Federated Multi-modal Visual Prompt Tuning for Vision-Language Models

要約 テキストプロンプトチューニングは、ネットワークの重みを凍結しながら、ローカ … 続きを読む

カテゴリー: cs.CV | コメントする

Many-Worlds Inverse Rendering

要約 物理的にベースの逆レンダラー内の表面を最適化する場合、不連続な視認性の変更 … 続きを読む

カテゴリー: cs.CV, cs.GR | コメントする

AI-GenBench: A New Ongoing Benchmark for AI-Generated Image Detection

要約 生成AIの急速な進歩は、画像の作成に革命をもたらし、テキストプロンプトから … 続きを読む

カテゴリー: cs.CV | コメントする

FLIM-based Salient Object Detection Networks with Adaptive Decoders

要約 Salient Object Detection(SOD)メソッドは、画像 … 続きを読む

カテゴリー: cs.CV | コメントする

EgoAgent: A Joint Predictive Agent Model in Egocentric Worlds

要約 この論文では、人間のように振る舞うエージェントモデルを学習するタスクに対処 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | コメントする

Video-Bench: Human-Aligned Video Generation Benchmark

要約 ビデオ生成評価は、生成モデルが視覚的に現実的で高品質のビデオを生成しながら … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする