「cs.AI」カテゴリーアーカイブ

AdPO: Enhancing the Adversarial Robustness of Large Vision-Language Models with Preference Optimization

投稿日: 2025年4月3日作成者: jarxiv

要約 GPT-4OやLlavaなどの大きなビジョン言語モデル（LVLMS）は、最 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Dual-stream Transformer-GCN Model with Contextualized Representations Learning for Monocular 3D Human Pose Estimation

投稿日: 2025年4月3日作成者: jarxiv

要約このペーパーでは、変圧器GCNデュアルストリームモデルを使用した文脈化され … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Leveraging Embedding Techniques in Multimodal Machine Learning for Mental Illness Assessment

投稿日: 2025年4月3日作成者: jarxiv

要約うつ病やPTSDなどの精神障害の世界的な有病率の増加には、客観的でスケーラ … 続きを読む →

カテゴリー: cs.AI, cs.CV, eess.AS | コメントを受け付けていません

Implicit Bias Injection Attacks against Text-to-Image Diffusion Models

投稿日: 2025年4月3日作成者: jarxiv

要約テキスト間拡散モデル（T2I DMS）の増殖により、日常生活にAIが生成し … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Ross3D: Reconstructive Visual Instruction Tuning with 3D-Awareness

投稿日: 2025年4月3日作成者: jarxiv

要約 2D画像とビデオ用の大規模なマルチモーダルモデル（LMMS）の急速な開発に … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.RO | コメントを受け付けていません

Cosmos-Reason1: From Physical Common Sense To Embodied Reasoning

投稿日: 2025年4月3日作成者: jarxiv

要約物理的なAIシステムは、物理的な世界で複雑な行動を認識し、理解し、実行する … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

FineLIP: Extending CLIP’s Reach via Fine-Grained Alignment with Longer Text Inputs

投稿日: 2025年4月3日作成者: jarxiv

要約先駆的なビジョン言語モデルとして、Clip（コントラスト言語イメージのプリ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

Equivariant Spherical CNNs for Accurate Fiber Orientation Distribution Estimation in Neonatal Diffusion MRI with Reduced Acquisition Time

投稿日: 2025年4月3日作成者: jarxiv

要約拡散磁気共鳴イメージング（DMRI）を使用した脳微細構造の早期かつ正確な評 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Sim-and-Real Co-Training: A Simple Recipe for Vision-Based Robotic Manipulation

投稿日: 2025年4月3日作成者: jarxiv

要約大規模な現実世界のロボットデータセットは、ジェネラリストのロボットモデルを … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.RO | コメントを受け付けていません

Non-Determinism of ‘Deterministic’ LLM Settings

投稿日: 2025年4月3日作成者: jarxiv

要約 LLM（大規模な言語モデル）開業医は、一般に、出力が決定論的と予想される設 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SE | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

AdPO: Enhancing the Adversarial Robustness of Large Vision-Language Models with Preference Optimization

Dual-stream Transformer-GCN Model with Contextualized Representations Learning for Monocular 3D Human Pose Estimation

Leveraging Embedding Techniques in Multimodal Machine Learning for Mental Illness Assessment

Implicit Bias Injection Attacks against Text-to-Image Diffusion Models

Ross3D: Reconstructive Visual Instruction Tuning with 3D-Awareness

Cosmos-Reason1: From Physical Common Sense To Embodied Reasoning

FineLIP: Extending CLIP’s Reach via Fine-Grained Alignment with Longer Text Inputs

Equivariant Spherical CNNs for Accurate Fiber Orientation Distribution Estimation in Neonatal Diffusion MRI with Reduced Acquisition Time

Sim-and-Real Co-Training: A Simple Recipe for Vision-Based Robotic Manipulation

Non-Determinism of ‘Deterministic’ LLM Settings

最近の投稿

最近のコメント

アーカイブ

カテゴリー