高职教育 > 计算机类
大语言模型技术与应用
书号:9787113314521 套系名称:
作者:王琦伟 顾一帆 周苏 出版日期:2024-09-01
定价:49.80 页码 / 开本:0 /16
策划编辑:汪敏 责任编辑:汪敏 彭立辉
适用专业:计算机类 适用层次:高职教育
最新印刷时间:2024-09-01
资源下载
教学课件
教学素材
习题答案
教学案例
教学设计(暂无)
教学视频(暂无)
内容简介
前言
目录
作者介绍
图书特色
本书针对职业教育“人工智能”课程编写。全书共14课,包括从人工智能起步、语言模型及其发展、大语言模型定义、大语言模型架构、人工数据标注、大语言模型预训练数据、组织大语言模型开发、大语言模型智能体、强化学习方法、提示工程技术、微调与检索增强生成、大语言模型应用框架、技术伦理与限制、面向通用人工智能等。本书理论与实践结合,可使读者深入了解人工智能领域和自然语言处理领域的最新技术和研究成果,提升专业技能与竞争力。 本书适合作为高等职业院校人工智能、大数据等相关专业的教材,也可供对人工智能以及大语言模型相关领域感兴趣的读者阅读参考。
前言 大语言模型是一种基于深度学习技术的先进人工智能模型,特别适用于理解和生成自然语言文本。大语言模型通常建立在Transformer架构之上,该架构因其高效的并行计算能力和优异的序列学习能力而被广泛应用。 大语言模型的特点在于其庞大的参数规模,通常含有数十亿乃至上万亿级别的参数,这让它们具备更强大的表达能力和泛化性能。大语言模型首先在大规模无标签文本数据上进行预训练,通过监督学习学会预测文本中的缺失部分。然后,经过微调,可以适应各种下游自然语言处理任务。通过学习大量文本数据,大语言模型不仅能解析文本的语法结构和语义含义,还能根据上下文生成连贯甚至是高度创造性的新文本内容。 相较于传统的单一用途自然语言处理模型,大语言模型的多功能性和通用性,使其能够在未经专门训练的情况下处理多种类型的自然语言任务。代表性的大语言模型有OpenAI的ChatGPT、阿里云的通义千问等。随着技术的发展,大语言模型已经成为自然语言处理领域的重要基石,并持续推动人工智能技术的进步和社会应用的拓展。 学习大语言模型相关课程,其意义在于: (1)理解技术前沿:大语言模型是人工智能领域的一大突破,通过学习本课程,可以深入了解该领域的最新技术和研究成果,紧跟人工智能发展的步伐。 (2)提升技能与竞争力:掌握大语言模型技术可以帮助个人在人工智能、自然语言处理等领域提高技术水平,增强就业竞争力,尤其是在涉及聊天机器人开发、问答系统构建、文本生成、语义理解和翻译等方面的工作。 (3)创新应用开发:大语言模型具有强大的语言生成和理解能力,学习本课程有助于启发和引导开发者设计并实施一系列创新应用,如辅助写作工具、在线客服系统、智能搜索引擎优化等。 (4)体现社会价值:随着大语言模型逐渐应用于日常生活和工作中,学习相关知识有助于更好地推动科技服务于社会,解决实际问题,例如无障碍沟通、教育资源普及、医疗健康咨询等。 (5)伦理与社会责任:了解大语言模型的同时,也能促使人们思考其在数据安全、隐私保护、消除偏见、防止滥用等方面带来的挑战和应对策略,从而培养负责任的技术创新能力。 可见,学习大语言模型课程不仅有利于个人专业成长,更能对社会进步和技术创新产生积极影响。人工智能及其大语言模型技术,是每个职业教育学生乃至社会人所必须关注、学习和重视的知识与现实。 本书针对职业院校学生的认知特点,为职业院校“大语言模型”课程编写。本书介绍的大语言模型知识主要包括从人工智能起步、语言模型及其发展、大语言模型定义、大语言模型架构、人工数据标注、大语言模型预训练数据、组织大语言模型开发、大语言模型智能体、强化学习方法、提示工程技术、微调与检索增强生成、大语言模型应用框架、技术伦理与限制、面向通用人工智能等。 本书在编写时遵循下列要点: (1)介绍与分析深入浅出,让读者能切实理解和掌握人工智能和大语言模型的相关知识与应用场景。 (2)经典案例丰富有趣,注重培养基本理论知识,重视培养学习方法。 (3)习题设置精心巧妙,让读者在自我检测中建构人工智能与大语言模型的基本观念与技术。 (4)理论与实践结合,为每一课知识点都设计了有针对性的“实训与思考”环节,在动手实践中融入人工智能与大语言模型发展进程。 此外,还为各课设计了作业(四选一标准选择题),学生只要认真阅读各课内容,所有题目都能准确回答,并且在附录A提供了作业参考答案,供读者对比思考。 本课程的教学进度设计见“课程教学进度表”,可作为教师授课和学生学习的参考。实际执行时,应按照教学大纲和校历中关于本学期节假日的安排,确定本课程的教学进度。 本课程的教学评测可以从这样几方面入手: (1)结合每课的课后作业(四选一标准选择题,14组)。 (2)结合各课知识内容安排的“实训与思考”环节,理论联系实际,切实掌握和应用课文知识(14组和一个课程学习与实训总结大作业)。 (3)随机抽查的课文阅读与笔记。 (4)结合平时考勤。 (5)任课老师认为必要的其他考核方法。 本书特色鲜明、易读易学,适合作为高等职业院校人工智能、大数据等相关专业的教材,也可供对人工智能以及大语言模型相关领域感兴趣的读者阅读参考。 本书配套授课电子课件,需要的教师可登录中国铁道出版社教育资源数字化平台https://www.tdpress.com/51eds下载。欢迎教师与作者交流并索取为本书教学配套的相关资料。电子邮箱:zhousu@qq.com;QQ:81505050。 本书由王琦伟、顾一帆、周苏主编,盛诚泽、范惠平、王文参与编写。在本书的编写过程中得到嘉善技师学院、浙大城市学院、杭州汇萃智能科技有限公司等多所院校、企业的支持,在此一并表示感谢! 由于时间仓促,加上编者水平有限,书中难免存在疏漏与不妥之处,恳请读者批评指正。 编 者 2024年夏于杭州西湖
目录 第1课 从人工智能起步1 1.1 人工智能概述2 1.1.1 “智能”的概念2 1.1.2 人工智能的历史3 1.1.3 人工智能定义3 1.1.4 人工智能大师4 1.2 人工智能实现途径5 1.3 人工智能知识要点6 1.3.1 计算机建模6 1.3.2 机器学习7 1.3.3 监督学习与无监督学习7 1.3.4 人工神经网络与深度学习9 1.4 大数据助力人工智能9 1.4.1 大数据三个思维转变10 1.4.2 大数据思维特点和原则10 1.4.3 大数据与人工智能相辅相成10 1.5 定义生成式人工智能11 1.5.1 关键特征和类型11 1.5.2 世界模型问题12 1.5.3 知识传递和语言支持13 1.5.4 开源和闭源14 作业14 【实训与思考】了解典型的大语言模型16 第2课 语言模型及其发展18 2.1 语言模型的定义19 2.2 语言模型发展的三个阶段20 2.2.1 基础模型阶段20 2.2.2 能力探索阶段20 2.2.3 突破发展阶段21 2.3 Transformer模型21 2.3.1 Transformer核心21 2.3.2 Transformer过程22 2.3.3 Transformer结构25 2.3.4 Transformer模块26 2.4 混合专家架构27 作业30 【实训与思考】熟悉阿里云大模型“通义千问”32 第3课 大语言模型定义35 3.1 Blockhead思维实验36 3.2 大语言模型的定义37 3.3 大语言模型工作原理37 3.3.1 大模型的研究基础38 3.3.2 词元及其标记化39 3.3.3 基础模型39 3.3.4 词嵌入及其含义40 3.3.5 基于Transformer模型40 3.3.6 自注意力机制41 3.3.7 生成和理解42 3.3.8 预训练过程与微调42 3.4 大模型的幻觉43 3.4.1 幻觉的分类43 3.4.2 产生幻觉的原因44 3.4.3 检测大模型病症45 3.4.4 减轻幻觉45 作业46 【实训与思考】字节跳动的AI产品:豆包48 第4课 大语言模型架构51 4.1 生成式预训练语言模型52 4.2 大语言模型生成技术53 4.2.1 思维链54 4.2.2 上下文学习58 4.2.3 指令微调59 4.2.4 零样本/少样本59 4.2.5 训练策略及优化59 4.3 多模态语言模型60 4.3.1 多模态指令微调61 4.3.2 多模态上下文学习61 4.3.3 多模态思维链61 4.3.4 大模型辅助视觉推理62 4.4 大语言模型的结构62 4.4.1 关键组成与设计原则62 4.4.2 稀疏注意力机制分类64 4.5 应用技术架构65 作业66 【实训与思考】熟悉百度大模型“文心一言”68 第5课 人工数据标注72 5.1 知识表示方法73 5.1.1 知识的概念73 5.1.2 知识表示的定义74 5.1.3 知识表示的过程75 5.2 数据标注概述75 5.3 数据标注分类76 5.3.1 图像标注77 5.3.2 语音标注78 5.3.3 3D点云标注78 5.3.4 文本标注79 5.4 执行数据标注79 5.4.1 制定标注规则79 5.4.2 数据标注过程80 5.4.3 标注团队管理82 5.5 智能数据标注83 作业83 【实训与思考】熟悉Globe Explorer智能搜索引擎85 第6课 大语言模型预训练数据87 6.1 数据来源89 6.1.1 通用数据89 6.1.2 专业数据90 6.2 数据处理91 6.2.1 质量过滤91 6.2.2 冗余去除92 6.2.3 隐私消除92 6.2.4 词元切分93 6.3 数据影响分析93 6.3.1 数据规模94 6.3.2 数据质量94 6.4 典型的开源数据集95 6.4.1 Pile数据集95 6.4.2 ROOTS96 6.5 数据集面临的挑战97 6.5.1 规模和质量待提升98 6.5.2 大模型与数据集相辅相成98 6.5.3 标准规范需健全99 6.5.4 存储性能待提高99 6.6 训练集、测试集、验证集的异同100 6.6.1 训练、测试与验证数据集的不同之处100 6.6.2 训练、测试与验证数据集的相似之处101 作业103 【实训与思考】熟悉科大讯飞大模型“讯飞星火认知”105 第7课 组织大语言模型开发109 7.1 大模型开发流程110 7.2 大模型数据处理112 7.2.1 数据采集112 7.2.2 数据清洗和预处理113 7.2.3 数据标注113 7.2.4 数据集划分114 7.2.5 模型设计114 7.2.6 模型初始化115 7.2.7 模型训练116 7.2.8 模型验证116 7.2.9 模型保存117 7.2.10 模型测试117 7.2.11 模型部署118 7.3 分而治之的思想118 7.3.1 分布式计算119 7.3.2 消息传递接口119 7.3.3 MapReduce模型120 7.3.4 批处理和流处理121 7.4 分布式训练与策略122 7.4.1 分布式训练概述122 7.4.2 数据并行性124 7.4.3 模型并行性124 7.4.4 流水线并行性125 7.4.5 混合并行126 7.4.6 分布式训练集群架构126 作业127 【实训与思考】程序员:文心大模型开发代码智能体129 第8课 大语言模型智能体131 8.1 智能体和环境132 8.2 智能体的良好行为133 8.2.1 性能度量133 8.2.2 理性133 8.3 环境的本质134 8.3.1 指定任务环境134 8.3.2 任务环境的属性135 8.4 智能体的结构137 8.4.1 智能体程序138 8.4.2 学习型智能体139 8.4.3 智能体组件的工作140 8.5 构建大模型智能体141 作业142 【实训与思考】人形机器人创业独角兽Figure AI144 第9课 强化学习方法146 9.1 强化学习概述147 9.1.1 强化学习的定义147 9.1.2 不同于监督和无监督学习148 9.1.3 不同于传统机器学习149 9.1.4 大模型的强化学习150 9.1.5 先验知识与标注数据151 9.2 强化学习基础151 9.2.1 基于模型与免模型环境151 9.2.2 探索与利用152 9.2.3 片段还是连续任务153 9.2.4 网络模型设计153 9.3 强化学习分类154 9.3.1 从奖励中学习154 9.3.2 被动与主动强化学习155 9.3.3 学徒学习155 9.4 深度强化学习156 作业157 【实训与思考】熟悉文生视频大模型Sora159 第10课 提示工程技术163 10.1 提示工程的定义164 10.2 提示的原理166 10.2.1 提示构成166 10.2.2 提示调优167 10.3 提示工程167 10.3.1 链式思考提示168 10.3.2 生成知识提示168 10.3.3 少样本提示 169 10.3.4 自一致提示169 10.3.5 思维树提示170 10.3.6 提示的通用技巧171 10.4 提示学习和语境学习172 10.4.1 提示学习172 10.4.2 语境学习174 10.4.3 提示学习与语境学习的关系175 作业175 【实验与思考】文生图:注册使用Midjourney绘图工具177 第11课 微调与检索增强生成180 11.1 微调的原因181 11.2 微调工程定义181 11.2.1 微调工程关键步骤182 11.2.2 上下文窗口扩展183 11.2.3 手动构建指令183 11.2.4 自动构建指令183 11.3 技术路线与流行方案185 11.3.1 微调技术路线185 11.3.2 提示微调185 11.3.3 前缀微调185 11.3.4 LoRA方法185 11.3.5 QLoRA方法186 11.4 检索增强生成技术186 11.4.1 信息检索基础186 11.4.2 检索增强生成的定义187 11.4.3 检索增强生成核心组成187 11.4.4 检索增强生成工作原理188 11.5 检索增强生成与微调对比188 作业189 【实训与思考】熟悉智谱华章大模型“智谱”192 第12课 大语言模型应用框架197 12.1 大语言模型哲学问题198 12.1.1 组成性198 12.1.2 天赋论与语言习得198 12.1.3 语言理解与基础199 12.2 大语言模型应用流程199 12.2.1 确定需求大小200 12.2.2 数据收集201 12.2.3 数据集预处理201 12.2.4 大模型预训练201 12.2.5 任务微调与部署202 12.3 大语言模型应用场景203 12.3.1 大模型典型应用领域203 12.3.2 大模型助力医疗诊断204 作业207 【实训与思考】精通垃圾分类的ZenRobotics机器人209 第13课 技术伦理与限制212 13.1 人工智能面临的伦理挑战213 13.1.1 人工智能与人类的关系213 13.1.2 人与智能机器的沟通214 13.2 数据隐私保护对策 215 13.2.1 数据主权和数据权问题215 13.2.2 数据利用失衡问题215 13.2.3 构建隐私保护伦理准则216 13.2.4 健全道德伦理约束机制216 13.3 人工智能伦理原则217 13.3.1 职业伦理准则的目标217 13.3.2 创新发展道德伦理宣言218 13.3.3 欧盟可信赖的伦理准则219 13.4 大模型的知识产权保护220 13.4.1 Midjourney绘画工具220 13.4.2 尊重隐私,保障安全,促进开放222 13.4.3 边缘群体的数字平等222 作业222 【实训与思考】人工智能独立完成的视觉艺术品无法获得版权224 第14课 面向通用人工智能226 14.1 生成式人工智能层次227 14.1.1 应用层227 14.1.2 平台层227 14.1.3 模型层228 14.1.4 基础设施层228 14.2 人工智能生成内容229 14.2.1 内容孪生230 14.2.2 内容编辑230 14.2.3 内容生成的应用230 14.3 视频作为新的决策语言231 14.4 人工智能发展愿景233 14.4.1 大模型用于智能制造234 14.4.2 预测人类行为的新模型234 14.5 通用人工智能涌现236 14.5.1 通用人工智能定义236 14.5.2 大模型与通用人工智能236 14.5.3 通用人工智能的关键特性237 14.5.4 从生成式人工智能迈向通用人工智能238 作业239 【实训与思考】利用人工智能生成内容完成人机交互界面设计241 附 录 245 附录A 作业参考答案245 附录B 课程学习与实训总结246 参考文献 250
王琦伟,男,毕业于浙江师范大学,现就职于嘉善县中等专业学校,主要从事计算机教学工作,著有《信息技术常用工具软件习题集》、《网络操作系统》。本书为作者第3本图书。扎根职教18年,先后担任班主任、计算机教研组长、年级部德育部长、资产信息中心副主任等工作。在这些职位上,始终以专业的技能和认真的态度履职,受到了师生一直以来的好评与赞誉。积极组织教师进行教研活动,促进教学方法的研讨和分享,提高教师的教学水平。通过持续的教学改进和创新,所带领的教研组多次获得市、县级先进称号,为学校的教育质量做出了突出贡献。个人荣获了浙派名师培养对象、嘉兴市名教师、嘉兴市优秀教师、嘉兴市最美教师提名奖、嘉兴市学科带头人等20余项先进荣誉。这些荣誉是对其工作的肯定,也是对其教育理念和专业能力的认可。,顾一帆,目前任职于嘉善县中等专业学校,近三年教学业务获奖情况:2021年6月获得嘉兴市青少年电脑机器人比赛优秀辅导员;7月被评为县十六届教学能手;8月教学论文获市三等奖;11月在教学课程比武中获得校级二等奖,并参加参与省教育资源开发。2022年 1月获得学校年度考核优秀,学校“学习强国”党员学习标兵;6月获嘉善县面向人人赛文字录入优秀指导教师,参加嘉善县职业学校命题能力评比获三等奖; 8月获得嘉兴市第十九届中小学机器人项目成果展示活动的优秀辅导员称号。2023年 1月获得年度教育工作中先进工作者;2月获得嘉兴市教育技术工作先进个人;5月获得嘉兴市青年工匠,省中职学校职业能力大赛短视频项目师生同赛-三等奖,参加嘉善县职业学校命题能力评比获三等奖,县中等职业学校教师命题能力比赛三等奖,县中职技能大赛优秀指导教师;6月获嘉善县面向人人赛文字录入优秀指导教师;12月获得嘉兴市职业教育案列市二等奖,全国信创行业赛优秀指导教师,全国信创行业赛职工组三等奖。,周苏,1982年华东水利学院计算机应用专业本科毕业,1986年由水电部研究所调入杭州大学计算机系任教,1991年破格晋升副教授,1999年调入浙江大学城市学院计算机系任教,2005年晋升教授。在杭州大学、浙江大学、浙江大学城市学院、浙江工业大学之江学院、温州大学城市学院、嘉兴学院南湖学院、温州职业技术学院等多所院校专/兼职任教,教学经验丰富。 长期从事计算机等专业教学工作,担任计算机基础、计算机导论、软件工程、软件测试技术、软件体系结构、电子商务概论、移动商务、多媒体技术、项目管理、管理信息系统、应用统计学、C语言程序设计、面向对象程序设计、网络传播技术、网络生态学、人机交互技术、艺术设计概论、艺术欣赏概论、计算机平面设计、信息管理与信息系统概论、信息资源管理、办公软件高级应用、IT应用文写作等课程的教学,对计算机学科教学以及应用型院校教学有深刻理解。
本书针对职业院校学生的认知特点,为职业院校“大语言模型”课程编写。本书介绍的大语言模型知识主要包括从人工智能起步、语言模型及其发展、大语言模型定义、大语言模型架构、人工数据标注、大语言模型预训练数据、组织大语言模型开发、大语言模型智能体、强化学习方法、提示工程技术、微调与检索增强生成、大语言模型应用框架、技术伦理与限制、面向通用人工智能等。