月別アーカイブ: 2024年1月

ECoFLaP: Efficient Coarse-to-Fine Layer-Wise Pruning for Vision-Language Models

要約 大規模ビジョン言語モデル (LVLM) は、さまざまなモダリティからの豊富 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | ECoFLaP: Efficient Coarse-to-Fine Layer-Wise Pruning for Vision-Language Models はコメントを受け付けていません

From GPT-4 to Gemini and Beyond: Assessing the Landscape of MLLMs on Generalizability, Trustworthiness and Causality through Four Modalities

要約 マルチモーダル大規模言語モデル (MLLM) は、マルチモーダル コンテン … 続きを読む

カテゴリー: cs.CV | From GPT-4 to Gemini and Beyond: Assessing the Landscape of MLLMs on Generalizability, Trustworthiness and Causality through Four Modalities はコメントを受け付けていません

ViR: Towards Efficient Vision Retention Backbones

要約 ビジョン トランスフォーマー (ViT) は、長距離の空間依存関係のモデリ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | ViR: Towards Efficient Vision Retention Backbones はコメントを受け付けていません

Annotated Hands for Generative Models

要約 GAN や拡散モデルなどの生成モデルは、優れた画像生成機能を実証しています … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR | Annotated Hands for Generative Models はコメントを受け付けていません

ECG-Image-Kit: A Synthetic Image Generation Toolbox to Facilitate Deep Learning-Based Electrocardiogram Digitization

要約 時系列データから現実的なアーティファクトを含む合成 ECG 画像を生成する … 続きを読む

カテゴリー: cs.CV, cs.LG | ECG-Image-Kit: A Synthetic Image Generation Toolbox to Facilitate Deep Learning-Based Electrocardiogram Digitization はコメントを受け付けていません

DiConStruct: Causal Concept-based Explanations through Black-Box Distillation

要約 モデルの解釈可能性は、人間と AI の意思決定システムにおいて中心的な役割 … 続きを読む

カテゴリー: cs.AI, cs.HC, cs.LG | DiConStruct: Causal Concept-based Explanations through Black-Box Distillation はコメントを受け付けていません

Semi-Supervised Active Learning for Semantic Segmentation in Unknown Environments Using Informative Path Planning

要約 セマンティック セグメンテーションにより、ロボットは幾何学を超えて環境を認 … 続きを読む

カテゴリー: cs.LG, cs.RO | Semi-Supervised Active Learning for Semantic Segmentation in Unknown Environments Using Informative Path Planning はコメントを受け付けていません

CMMU: A Benchmark for Chinese Multi-modal Multi-type Question Understanding and Reasoning

要約 マルチモーダル大規模言語モデル (MLLM) は目覚ましい進歩を遂げ、強力 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.MM | CMMU: A Benchmark for Chinese Multi-modal Multi-type Question Understanding and Reasoning はコメントを受け付けていません

DeepSeek-Coder: When the Large Language Model Meets Programming — The Rise of Code Intelligence

要約 大規模な言語モデルの急速な開発により、ソフトウェア開発におけるコード イン … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SE | DeepSeek-Coder: When the Large Language Model Meets Programming — The Rise of Code Intelligence はコメントを受け付けていません

Enhancing the Performance of Pneu-net Actuators Using a Torsion Resistant Strain Limiting Layer

要約 Pneunets は、ソフト ロボット グリッパーの主な形式です。 広く普 … 続きを読む

カテゴリー: cs.RO | Enhancing the Performance of Pneu-net Actuators Using a Torsion Resistant Strain Limiting Layer はコメントを受け付けていません