cs.AI」カテゴリーアーカイブ

A Cognitive Evaluation Benchmark of Image Reasoning and Description for Large Vision Language Models

要約 Large Vision Language Model (LVLM) は、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | A Cognitive Evaluation Benchmark of Image Reasoning and Description for Large Vision Language Models はコメントを受け付けていません

Text2Pic Swift: Enhancing Long-Text to Image Retrieval for Large-Scale Libraries

要約 テキストから画像への検索は、テキスト クエリを使用した画像の検索を可能にす … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.IR | Text2Pic Swift: Enhancing Long-Text to Image Retrieval for Large-Scale Libraries はコメントを受け付けていません

TFMQ-DM: Temporal Feature Maintenance Quantization for Diffusion Models

要約 画像生成の一般的なフレームワークである拡散モデルは、推論時間の延長と大量の … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | TFMQ-DM: Temporal Feature Maintenance Quantization for Diffusion Models はコメントを受け付けていません

Sora: A Review on Background, Technology, Limitations, and Opportunities of Large Vision Models

要約 Sora は、2024 年 2 月に OpenAI によってリリースされた … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Sora: A Review on Background, Technology, Limitations, and Opportunities of Large Vision Models はコメントを受け付けていません

ToDo: Token Downsampling for Efficient Generation of High-Resolution Images

要約 注意メカニズムは画像拡散モデルにとって重要ですが、二次計算の複雑さにより、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | ToDo: Token Downsampling for Efficient Generation of High-Resolution Images はコメントを受け付けていません

Compass: A Decentralized Scheduler for Latency-Sensitive ML Workflows

要約 私たちは、GPU 対応ワーカーが連携して複雑なクエリを実行する分散システム … 続きを読む

カテゴリー: cs.AI, cs.DC | Compass: A Decentralized Scheduler for Latency-Sensitive ML Workflows はコメントを受け付けていません

OmniACT: A Dataset and Benchmark for Enabling Multimodal Generalist Autonomous Agents for Desktop and Web

要約 何十年もの間、人間とコンピューターのやり取りは基本的に手動で行われてきまし … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.HC | OmniACT: A Dataset and Benchmark for Enabling Multimodal Generalist Autonomous Agents for Desktop and Web はコメントを受け付けていません

Autonomous Vehicles: Evolution of Artificial Intelligence and Learning Algorithms

要約 自動運転車の出現は交通分野に変革の時代をもたらし、最先端のテクノロジーを通 … 続きを読む

カテゴリー: cs.AI, cs.LG | Autonomous Vehicles: Evolution of Artificial Intelligence and Learning Algorithms はコメントを受け付けていません

Ask Again, Then Fail: Large Language Models’ Vacillations in Judgement

要約 現在の会話言語モデルは、たとえ最初の判断が正しかったとしても、フォローアッ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Ask Again, Then Fail: Large Language Models’ Vacillations in Judgement はコメントを受け付けていません

Robot at the Mirror: Learning to Imitate via Associating Self-supervised Models

要約 トレーニングや微調整ではなく、関連付けを介して既製の自己教師ありモデルから … 続きを読む

カテゴリー: cs.AI, cs.RO, I.2.9 | Robot at the Mirror: Learning to Imitate via Associating Self-supervised Models はコメントを受け付けていません