-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CL」カテゴリーアーカイブ
Exact Aggregation for Federated and Efficient Fine-Tuning of Foundation Models
要約 低ランク適応 (LoRA) は、基礎モデルを効率的に微調整するための一般的 … 続きを読む
MoTe: Learning Motion-Text Diffusion Model for Multiple Generation Tasks
要約 最近、人間の動作分析は、ノイズ除去拡散モデルや大規模言語モデルなどの刺激的 … 続きを読む
A Survey on Multimodal Large Language Models
要約 最近、GPT-4V に代表されるマルチモーダル大規模言語モデル (MLLM … 続きを読む
SIMS: Simulating Human-Scene Interactions with Real World Script Planning
要約 長期にわたるヒューマンシーンとシーンのインタラクションをシミュレートするこ … 続きを読む
On Domain-Specific Post-Training for Multimodal Large Language Models
要約 近年、一般的なマルチモーダル大規模言語モデル (MLLM) の急速な発展が … 続きを読む
VLSBench: Unveiling Visual Leakage in Multimodal Safety
要約 マルチモーダル大規模言語モデル (MLLM) の安全性に関する懸念は、さま … 続きを読む
Perception Test 2024: Challenge Summary and a Novel Hour-Long VideoQA Benchmark
要約 2023 年版の成功に続き、最先端のビデオ モデルのベンチマークと測定を目 … 続きを読む
T2Vid: Translating Long Text into Multi-Image is the Catalyst for Video-LLMs
要約 画像領域におけるマルチモーダル大規模言語モデル (MLLM) の成功は、研 … 続きを読む
Large Language Model-Brained GUI Agents: A Survey
要約 GUI は長い間、人間とコンピューターの対話の中心であり、デジタル システ … 続きを読む
Don’t Command, Cultivate: An Exploratory Study of System-2 Alignment
要約 o1 システム カードは、o1 モデルが OpenAI 内で最も堅牢である … 続きを読む
カテゴリー: cs.CL
Don’t Command, Cultivate: An Exploratory Study of System-2 Alignment はコメントを受け付けていません