「cs.AI」カテゴリーアーカイブ

A Cognitive Evaluation Benchmark of Image Reasoning and Description for Large Vision Language Models

投稿日: 2024年2月29日作成者: jarxiv

要約 Large Vision Language Model (LVLM) は、 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

Text2Pic Swift: Enhancing Long-Text to Image Retrieval for Large-Scale Libraries

投稿日: 2024年2月29日作成者: jarxiv

要約テキストから画像への検索は、テキストクエリを使用した画像の検索を可能にす … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.IR | コメントを受け付けていません

TFMQ-DM: Temporal Feature Maintenance Quantization for Diffusion Models

投稿日: 2024年2月29日作成者: jarxiv

要約画像生成の一般的なフレームワークである拡散モデルは、推論時間の延長と大量の … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Sora: A Review on Background, Technology, Limitations, and Opportunities of Large Vision Models

投稿日: 2024年2月29日作成者: jarxiv

要約 Sora は、2024 年 2 月に OpenAI によってリリースされた … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

ToDo: Token Downsampling for Efficient Generation of High-Resolution Images

投稿日: 2024年2月29日作成者: jarxiv

要約注意メカニズムは画像拡散モデルにとって重要ですが、二次計算の複雑さにより、 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Compass: A Decentralized Scheduler for Latency-Sensitive ML Workflows

投稿日: 2024年2月29日作成者: jarxiv

要約私たちは、GPU 対応ワーカーが連携して複雑なクエリを実行する分散システム … 続きを読む →

カテゴリー: cs.AI, cs.DC | コメントを受け付けていません

OmniACT: A Dataset and Benchmark for Enabling Multimodal Generalist Autonomous Agents for Desktop and Web

投稿日: 2024年2月29日作成者: jarxiv

要約何十年もの間、人間とコンピューターのやり取りは基本的に手動で行われてきまし … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.HC | コメントを受け付けていません

Autonomous Vehicles: Evolution of Artificial Intelligence and Learning Algorithms

投稿日: 2024年2月29日作成者: jarxiv

要約自動運転車の出現は交通分野に変革の時代をもたらし、最先端のテクノロジーを通 … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Ask Again, Then Fail: Large Language Models’ Vacillations in Judgement

投稿日: 2024年2月29日作成者: jarxiv

要約現在の会話言語モデルは、たとえ最初の判断が正しかったとしても、フォローアッ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Robot at the Mirror: Learning to Imitate via Associating Self-supervised Models

投稿日: 2024年2月28日作成者: jarxiv

要約トレーニングや微調整ではなく、関連付けを介して既製の自己教師ありモデルから … 続きを読む →

カテゴリー: cs.AI, cs.RO, I.2.9 | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

A Cognitive Evaluation Benchmark of Image Reasoning and Description for Large Vision Language Models

Text2Pic Swift: Enhancing Long-Text to Image Retrieval for Large-Scale Libraries

TFMQ-DM: Temporal Feature Maintenance Quantization for Diffusion Models

Sora: A Review on Background, Technology, Limitations, and Opportunities of Large Vision Models

ToDo: Token Downsampling for Efficient Generation of High-Resolution Images

Compass: A Decentralized Scheduler for Latency-Sensitive ML Workflows

OmniACT: A Dataset and Benchmark for Enabling Multimodal Generalist Autonomous Agents for Desktop and Web

Autonomous Vehicles: Evolution of Artificial Intelligence and Learning Algorithms

Ask Again, Then Fail: Large Language Models’ Vacillations in Judgement

Robot at the Mirror: Learning to Imitate via Associating Self-supervised Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー