大语言模型
作者: 赵鑫 李军毅 周昆 唐天一 文继荣
出版年:2024.5
页数:377
ISBN:9786238730728
作品简介:
大语言模型技术的发展并非一蹴而就,它经历了从统计语言模型到神经网络语言模型,再到预训练语言模型的演变。OpenAI公司的GPT系列模型作为这一领域的佼佼者,引领了技术变革。然而,自GPT-3起,核心技术细节便鲜少公开,这给学术界的研究带来了挑战。
本书强调了开放和共享的重要性。书中详细介绍了大模型技术的整体训练流程、数据清洗方法、指令微调技术等关键技术点。此外,还提供了丰富的配套资源,如LLMBox代码库和YuLan大模型代码库,为读者提供了实践的便利。本书自2023年12月底启动编写,中文版本24年4月15日更新开源。《大语言模型》是一本全面介绍大语言模型技术的书籍,它不仅涵盖了基础原理和关键技术,还展望了技术的未来应用前景。中文版书籍注重为大模型技术的入门读者提供讲解,力图展现一个整体的大模型技术框架和路线图。本书适用于具有深度学习基础的高年级本科生以及低年级研究生使用,可以作为一本入门级的技术书籍。
