cs.AI」カテゴリーアーカイブ

MIMIR: Masked Image Modeling for Mutual Information-based Adversarial Robustness

要約 ビジョン トランスフォーマー (ViT) は、畳み込みニューラル ネットワ … 続きを読む

カテゴリー: cs.AI, cs.CV | MIMIR: Masked Image Modeling for Mutual Information-based Adversarial Robustness はコメントを受け付けていません

DaFoEs: Mixing Datasets towards the generalization of vision-state deep-learning Force Estimation in Minimally Invasive Robotic Surgery

要約 低侵襲ロボット手術 (MIRS) における安全なインタラクション中の接触力 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | DaFoEs: Mixing Datasets towards the generalization of vision-state deep-learning Force Estimation in Minimally Invasive Robotic Surgery はコメントを受け付けていません

3D Scene Geometry Estimation from 360$^\circ$ Imagery: A Survey

要約 このペーパーでは、全方向光学系でキャプチャされた 1 つ、2 つ、または複 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG | 3D Scene Geometry Estimation from 360$^\circ$ Imagery: A Survey はコメントを受け付けていません

A Probabilistic Fluctuation based Membership Inference Attack for Diffusion Models

要約 Membership Inference Attack (MIA) は、モ … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.CV, cs.LG | A Probabilistic Fluctuation based Membership Inference Attack for Diffusion Models はコメントを受け付けていません

Diffusion-Based Adversarial Sample Generation for Improved Stealthiness and Controllability

要約 ニューラル ネットワークは、敵対的なサンプル、つまりモデルを意図的に誤解さ … 続きを読む

カテゴリー: cs.AI, cs.CV | Diffusion-Based Adversarial Sample Generation for Improved Stealthiness and Controllability はコメントを受け付けていません

SceneVerse: Scaling 3D Vision-Language Learning for Grounded Scene Understanding

要約 言語を 3D 物理環境に合わせることに焦点を当てた 3D 視覚と言語の基礎 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | SceneVerse: Scaling 3D Vision-Language Learning for Grounded Scene Understanding はコメントを受け付けていません

Vlogger: Make Your Dream A Vlog

要約 この研究では、ユーザー説明の分レベルのビデオ ブログ (つまり、vlog) … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | Vlogger: Make Your Dream A Vlog はコメントを受け付けていません

Carrying over algorithm in transformers

要約 加算はおそらく考えられる最も単純な算術タスクの 1 つであり、通常は繰り越 … 続きを読む

カテゴリー: cs.AI, cs.LG | Carrying over algorithm in transformers はコメントを受け付けていません

An Explainable Proxy Model for Multiabel Audio Segmentation

要約 オーディオ信号のセグメンテーションは、自動オーディオ インデックス作成の重 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.SD, eess.AS, eess.SP | An Explainable Proxy Model for Multiabel Audio Segmentation はコメントを受け付けていません

CLadder: Assessing Causal Reasoning in Language Models

要約 因果推論を実行する能力は、知能の中核機能であると広く考えられています。 こ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | CLadder: Assessing Causal Reasoning in Language Models はコメントを受け付けていません