cs.AI」カテゴリーアーカイブ

Causal-Story: Local Causal Attention Utilizing Parameter-Efficient Tuning For Visual Story Synthesis

要約 拡散モデルの優れたテキストから画像への合成機能により、一貫したビジュアル … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | Causal-Story: Local Causal Attention Utilizing Parameter-Efficient Tuning For Visual Story Synthesis はコメントを受け付けていません

Are Language Models Puzzle Prodigies? Algorithmic Puzzles Unveil Serious Challenges in Multimodal Reasoning

要約 この論文では、視覚的な質問応答のコンテキスト内で組み立てられた、マルチモー … 続きを読む

カテゴリー: cs.AI, cs.CV | Are Language Models Puzzle Prodigies? Algorithmic Puzzles Unveil Serious Challenges in Multimodal Reasoning はコメントを受け付けていません

Redefining cystoscopy with ai: bladder cancer diagnosis using an efficient hybrid cnn-transformer model

要約 膀胱がんは、世界中で診断数の多いがんのトップ 10 にランクされており、再 … 続きを読む

カテゴリー: cs.AI, cs.CV | Redefining cystoscopy with ai: bladder cancer diagnosis using an efficient hybrid cnn-transformer model はコメントを受け付けていません

Latent Dataset Distillation with Diffusion Models

要約 機械学習の有効性は従来、ますます大規模になるデータセットの利用可能性に依存 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Latent Dataset Distillation with Diffusion Models はコメントを受け付けていません

Hierarchical Diffusion Policy for Kinematics-Aware Multi-Task Robotic Manipulation

要約 この論文では、マルチタスクのロボット操作のための階層エージェントである H … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Hierarchical Diffusion Policy for Kinematics-Aware Multi-Task Robotic Manipulation はコメントを受け付けていません

Improving Adversarial Attacks on Latent Diffusion Model

要約 最先端の画像生成モデルである潜在拡散モデル (LDM) に対する敵対的攻撃 … 続きを読む

カテゴリー: cs.AI, cs.CV | Improving Adversarial Attacks on Latent Diffusion Model はコメントを受け付けていません

Benchmarking the Text-to-SQL Capability of Large Language Models: A Comprehensive Evaluation

要約 Large Language Model (LLM) は、Text-to- … 続きを読む

カテゴリー: cs.AI, cs.CL | Benchmarking the Text-to-SQL Capability of Large Language Models: A Comprehensive Evaluation はコメントを受け付けていません

ImgTrojan: Jailbreaking Vision-Language Models with ONE Image

要約 大規模言語モデル (LLM) と人間の価値観の整合性への関心が高まっていま … 続きを読む

カテゴリー: cs.AI, cs.CV | ImgTrojan: Jailbreaking Vision-Language Models with ONE Image はコメントを受け付けていません

A Prefrontal Cortex-inspired Architecture for Planning in Large Language Models

要約 大規模言語モデル (LLM) は、さまざまなタスクで優れたパフォーマンスを … 続きを読む

カテゴリー: cs.AI, cs.NE | A Prefrontal Cortex-inspired Architecture for Planning in Large Language Models はコメントを受け付けていません

Pseudo-Labeling and Contextual Curriculum Learning for Online Grasp Learning in Robotic Bin Picking

要約 一般的な把握予測方法は主にオフライン学習に依存しており、新しいピッキング … 続きを読む

カテゴリー: cs.AI, cs.RO | Pseudo-Labeling and Contextual Curriculum Learning for Online Grasp Learning in Robotic Bin Picking はコメントを受け付けていません