cs.CL」カテゴリーアーカイブ

SynWorld: Virtual Scenario Synthesis for Agentic Action Knowledge Refinement

要約 エージェントとその環境間の相互作用において、エージェントはアクションを計画 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MA | SynWorld: Virtual Scenario Synthesis for Agentic Action Knowledge Refinement はコメントを受け付けていません

RICO: Improving Accuracy and Completeness in Image Recaptioning via Visual Reconstruction

要約 画像の復帰は、さまざまなマルチモーダルタスクの品質が向上したトレーニングデ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | RICO: Improving Accuracy and Completeness in Image Recaptioning via Visual Reconstruction はコメントを受け付けていません

Chain-of-Talkers (CoTalk): Fast Human Annotation of Dense Image Captions

要約 密に注釈付きの画像キャプションは、堅牢な視覚系のアラインメントの学習を大幅 … 続きを読む

カテゴリー: cs.CL, cs.CV | Chain-of-Talkers (CoTalk): Fast Human Annotation of Dense Image Captions はコメントを受け付けていません

Spatial Knowledge Graph-Guided Multimodal Synthesis

要約 マルチモーダル大手言語モデル(MLLM)の最近の進歩により、能力が大幅に向 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | Spatial Knowledge Graph-Guided Multimodal Synthesis はコメントを受け付けていません

Sherlock: Self-Correcting Reasoning in Vision-Language Models

要約 推論ビジョン言語モデル(VLM)は、複雑なマルチモーダルタスクで有望なパフ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | Sherlock: Self-Correcting Reasoning in Vision-Language Models はコメントを受け付けていません

3DLLM-Mem: Long-Term Spatial-Temporal Memory for Embodied 3D Large Language Model

要約 人間は、時間的および空間的経験を越えて長期的なメモリを活用することにより、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | 3DLLM-Mem: Long-Term Spatial-Temporal Memory for Embodied 3D Large Language Model はコメントを受け付けていません

Something’s Fishy In The Data Lake: A Critical Re-evaluation of Table Union Search Benchmarks

要約 最近のテーブル表現学習およびデータ発見方法は、データレイク内のテーブルユニ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.DB, cs.IR, cs.LG | Something’s Fishy In The Data Lake: A Critical Re-evaluation of Table Union Search Benchmarks はコメントを受け付けていません

PEDANTIC: A Dataset for the Automatic Examination of Definiteness in Patent Claims

要約 特許請求は、発明の保護範囲を定義します。 請求に曖昧さがある場合、それは特 … 続きを読む

カテゴリー: cs.CL | PEDANTIC: A Dataset for the Automatic Examination of Definiteness in Patent Claims はコメントを受け付けていません

Pangu Pro MoE: Mixture of Grouped Experts for Efficient Sparsity

要約 大規模な言語モデルにおける専門家(MOE)の混合物の外科は、はるかに大きな … 続きを読む

カテゴリー: cs.CL | Pangu Pro MoE: Mixture of Grouped Experts for Efficient Sparsity はコメントを受け付けていません

Visuospatial Cognitive Assistant

要約 ビデオベースの空間認知は、ロボット工学と具体化されたAIにとって不可欠です … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | Visuospatial Cognitive Assistant はコメントを受け付けていません