cs.AI」カテゴリーアーカイブ

AdPO: Enhancing the Adversarial Robustness of Large Vision-Language Models with Preference Optimization

要約 GPT-4OやLlavaなどの大きなビジョン言語モデル(LVLMS)は、最 … 続きを読む

カテゴリー: cs.AI, cs.CV | AdPO: Enhancing the Adversarial Robustness of Large Vision-Language Models with Preference Optimization はコメントを受け付けていません

Dual-stream Transformer-GCN Model with Contextualized Representations Learning for Monocular 3D Human Pose Estimation

要約 このペーパーでは、変圧器GCNデュアルストリームモデルを使用した文脈化され … 続きを読む

カテゴリー: cs.AI, cs.CV | Dual-stream Transformer-GCN Model with Contextualized Representations Learning for Monocular 3D Human Pose Estimation はコメントを受け付けていません

Leveraging Embedding Techniques in Multimodal Machine Learning for Mental Illness Assessment

要約 うつ病やPTSDなどの精神障害の世界的な有病率の増加には、客観的でスケーラ … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.AS | Leveraging Embedding Techniques in Multimodal Machine Learning for Mental Illness Assessment はコメントを受け付けていません

Implicit Bias Injection Attacks against Text-to-Image Diffusion Models

要約 テキスト間拡散モデル(T2I DMS)の増殖により、日常生活にAIが生成し … 続きを読む

カテゴリー: cs.AI, cs.CV | Implicit Bias Injection Attacks against Text-to-Image Diffusion Models はコメントを受け付けていません

Ross3D: Reconstructive Visual Instruction Tuning with 3D-Awareness

要約 2D画像とビデオ用の大規模なマルチモーダルモデル(LMMS)の急速な開発に … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.RO | Ross3D: Reconstructive Visual Instruction Tuning with 3D-Awareness はコメントを受け付けていません

Cosmos-Reason1: From Physical Common Sense To Embodied Reasoning

要約 物理的なAIシステムは、物理的な世界で複雑な行動を認識し、理解し、実行する … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Cosmos-Reason1: From Physical Common Sense To Embodied Reasoning はコメントを受け付けていません

FineLIP: Extending CLIP’s Reach via Fine-Grained Alignment with Longer Text Inputs

要約 先駆的なビジョン言語モデルとして、Clip(コントラスト言語イメージのプリ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | FineLIP: Extending CLIP’s Reach via Fine-Grained Alignment with Longer Text Inputs はコメントを受け付けていません

Equivariant Spherical CNNs for Accurate Fiber Orientation Distribution Estimation in Neonatal Diffusion MRI with Reduced Acquisition Time

要約 拡散磁気共鳴イメージング(DMRI)を使用した脳微細構造の早期かつ正確な評 … 続きを読む

カテゴリー: cs.AI, cs.CV | Equivariant Spherical CNNs for Accurate Fiber Orientation Distribution Estimation in Neonatal Diffusion MRI with Reduced Acquisition Time はコメントを受け付けていません

Sim-and-Real Co-Training: A Simple Recipe for Vision-Based Robotic Manipulation

要約 大規模な現実世界のロボットデータセットは、ジェネラリストのロボットモデルを … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Sim-and-Real Co-Training: A Simple Recipe for Vision-Based Robotic Manipulation はコメントを受け付けていません

Non-Determinism of ‘Deterministic’ LLM Settings

要約 LLM(大規模な言語モデル)開業医は、一般に、出力が決定論的と予想される設 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SE | Non-Determinism of ‘Deterministic’ LLM Settings はコメントを受け付けていません