cs.CL」カテゴリーアーカイブ

RoboTwin: Dual-Arm Robot Benchmark with Generative Digital Twins (early version)

要約 ロボット工学の急速に進歩する分野では、デュアルアーム調整と複雑なオブジェク … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.RO | RoboTwin: Dual-Arm Robot Benchmark with Generative Digital Twins (early version) はコメントを受け付けていません

Efficient Contrastive Decoding with Probabilistic Hallucination Detection – Mitigating Hallucinations in Large Vision Language Models –

要約 大規模なビジョン言語モデル(LVLMS)の最近の進歩にもかかわらず、これら … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Efficient Contrastive Decoding with Probabilistic Hallucination Detection – Mitigating Hallucinations in Large Vision Language Models – はコメントを受け付けていません

Document Parsing Unveiled: Techniques, Challenges, and Prospects for Structured Information Extraction

要約 ドキュメント解析は、契約、学術論文、請求書などの非構造化および半構造化され … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | Document Parsing Unveiled: Techniques, Challenges, and Prospects for Structured Information Extraction はコメントを受け付けていません

Taming Data and Transformers for Audio Generation

要約 アンビエントサウンドジェネレーターのスケーラビリティは、データ不足、キャプ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.MM, cs.SD, eess.AS | Taming Data and Transformers for Audio Generation はコメントを受け付けていません

Automatic Item Generation for Personality Situational Judgment Tests with Large Language Models

要約 特に状況判断テスト(SJTS)を通じて、人格評価は、心理的研究、人材選択、 … 続きを読む

カテゴリー: cs.AI, cs.CL, I.2.1 | Automatic Item Generation for Personality Situational Judgment Tests with Large Language Models はコメントを受け付けていません

Automated Python Translation

要約 Pythonは、業界と教育で最も一般的に使用されるプログラミング言語の1つ … 続きを読む

カテゴリー: cs.CL | Automated Python Translation はコメントを受け付けていません

UI-E2I-Synth: Advancing GUI Grounding with Large-Scale Instruction Synthesis

要約 大規模なビジョン言語モデルの最近の進歩は、デジタルデバイスの生産性を高める … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.HC | UI-E2I-Synth: Advancing GUI Grounding with Large-Scale Instruction Synthesis はコメントを受け付けていません

CleanMAP: Distilling Multimodal LLMs for Confidence-Driven Crowdsourced HD Map Updates

要約 インテリジェント接続車両(I​​CV)と統合された車両ロードクラウドシステ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO, I.2.10 | CleanMAP: Distilling Multimodal LLMs for Confidence-Driven Crowdsourced HD Map Updates はコメントを受け付けていません

LanguageMPC: Large Language Models as Decision Makers for Autonomous Driving

要約 既存の学習ベースの自律運転(AD)システムは、高レベルの情報を理解し、まれ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | LanguageMPC: Large Language Models as Decision Makers for Autonomous Driving はコメントを受け付けていません

DeepMLF: Multimodal language model with learnable tokens for deep fusion in sentiment analysis

要約 マルチモーダル融合はマルチモーダルセンチメント分析(MSA)で広く研究され … 続きを読む

カテゴリー: cs.AI, cs.CL | DeepMLF: Multimodal language model with learnable tokens for deep fusion in sentiment analysis はコメントを受け付けていません