人工智能期末复习简答题汇总,答案仅供参考

课本为:人工智能教程 第2版(张仰森,黄改娟编著),如有需要可在评论区留言。


1. 三大学派 P6

每个学派的思想,代表的成果,每个时期成果之间的关系(相对统一)

1.1 符号主义

符号主义将智能视为符号运算,认为通过逻辑推理和规则系统可以模拟人类思维。早期代表有逻辑理论家和专家系统,展现了基于知识的推理能力,但受限于知识获取困难。随着深度学习兴起,符号主义虽不再是主流,但其可解释性优势促成了与神经网络的融合,形成神经符号计算等新方向。

1.2 联结主义

联结主义认为人工智能的基本单位是神经元,认知过程是由神经元构成的网络的信息传递。主张运用仿生学的方法进行研究。从早期的MP模型到反向传播算法,再到深度学习的突破,该学派已成为AI主流,但数据依赖和可解释性不足仍是挑战。。

1.3 行为主义

行为主义提出智能取决于感知和行动,取决于对外界复杂环境的适应,主张应用进化论的思想进行人工智能的研究。关注智能体与环境的交互学习,通过强化学习和进化算法优化决策。 从早期的Q学习到深度强化学习,该学派优势在于动态适应能力,但训练效率低,常需与神经网络结合以提升性能。

1.4三大学派的关系

符号主义注重推理,联结主义擅长感知,行为主义强调交互。现代AI趋向融合:符号系统增强可解释性,神经网络处理复杂数据,强化学习优化决策。

2. 产生式系统(产生式规则表达式)P25

提示:三部分为规则库、综合数据库、推理机。从构建系统解决问题的角度去描述,怎么样构建这三个模块,以及构建完成后的工作过程(匹配、冲突解决和操作)。

2.1 请结合产生式系统的基本组成部分简要分析疾病诊断系统的构建及推理过程。

2.1.1 规则库构建

疾病诊断系统的规则库由"症状-疾病"关联规则组成,如"发热+咳嗽→疑似流感"。构建时需要医学专家将临床知识转化为if-then规则,并按疾病类型分类存储。关键要确保规则覆盖常见病症,并设置置信度处理不确定情况。

2.1.2 综合数据库设计

数据库实时存储患者就诊数据,包括主诉、查体结果和检验指标。采用结构化存储方式,如症状表、检验结果表等,并建立索引加快查询速度。新录入的检查数据会立即更新,为规则匹配提供最新依据。

2.1.3 推理机实现

推理机采用正向链从症状推导疾病,结合逆向链验证假设。使用Rete算法快速匹配规则,当多条规则触发时,按特异性优先等策略解决冲突。系统会记录推理路径,供医生查看诊断依据。

2.1.4 诊断工作流程

系统循环执行三个步骤:首先匹配患者数据与规则条件,然后解决规则冲突(如优先选择更具体的疾病),最后执行诊断操作(给出结论或建议检查)。整个过程透明可追溯,医生可随时介入调整。

2.2 ​​​​​​​请结合产生式系统的基本组成部分简要分析动物识别系统的构建及推理过程。

2.2.1 规则库

动物识别系统的规则库包含"特征-动物"关联规则,如"有羽毛+会飞→鸟类"。构建时需要动物学专家将鉴别特征转化为if-then规则,按照动物分类学层级组织。规则需覆盖常见动物的关键鉴别特征,并为模糊特征设置置信度权重。(例如,"有蹄+反刍→偶蹄目动物"这样的规则应包含典型特征组合。)

2.2.2 综合数据库

数据库存储观察到的动物特征数据,包括外形特征、行为特征等。采用结构化方式存储,如体型、体色、栖息地等字段,支持特征值的快速匹配。当用户输入新观察到的特征时,数据库即时更新,为后续推理提供最新依据。

2.2.3 推理机

推理机采用正向链推理,从观察特征推导可能的动物种类。使用改进的Rete算法进行高效规则匹配,当多个规则同时触发时(如"虎"和"斑马"都符合条纹特征),采用特征特异性优先等策略解决冲突。系统会记录推理路径,输出最可能的动物种类及判断依据。

2.2.4 工作过程

系统循环执行特征匹配、冲突解决和结果输出三个步骤。首先将观察特征与规则前提匹配,筛选候选动物;然后通过冲突解决策略(如优先匹配更具体的特征组合)确定最可能结果;最后输出识别结论并建议需要进一步观察的特征。整个过程支持交互式特征补充,逐步提高识别准确率。

3. 使用遗传算法进行模型优化 P345

构建模型优化过程,描述构建种群,每个个体,构建一个适应度函数,通过评价每个个体的适应度函数值来评估个体的适应能力,来进行后面的总的迭代。把交错的个体复制到下一代,再以一定的比例进行交叉和变异使形成新的一代的种群。重复这样的过程,迭代更新,直到优化的次数达到一定程度或者已经使函数值较优了,中止这样的过程。明确变异率、重复率、迭代率参数的描述。

​​​​​​​3.1 请简述遗传算法的基本处理过程和主要内容,并分析如何优化神经网络模型的学习。

遗传算法首先需要构建初始种群,每个个体代表神经网络的一组参数(如权重和偏置),这些参数通过编码方式(如二进制或实数编码)表示。种群规模通常设为50-500个个体,确保足够的多样性。

为评估个体优劣,需要设计适应度函数,对神经网络而言常用验证集准确率或损失函数值作为评价标准。适应度函数值越高,表示该组参数性能越好,被选中繁殖的概率越大。

算法通过选择、交叉和变异操作迭代更新种群。选择操作按照适应度比例保留优秀个体(如轮盘赌选择),交叉操作以60-90%的概率交换两个个体的部分基因,变异操作则以1-5%的概率随机改变某些基因值。这些操作共同产生新一代种群。

迭代过程中,算法持续监控适应度变化,当达到预设迭代次数或适应度提升小于阈值时终止。最终输出适应度最高的个体作为优化后的神经网络参数。该方法能有效跳出局部最优,特别适合优化复杂的深度神经网络结构。

​​​​​​​3.2 请简述遗传算法的基本处理过程和主要内容,并分析如何应用在神经网络的学习中。

提示:遗传算法在神经网络中的应用主要反应在3个方面:网络的学习(学习规则的优化、网络权系数的优化)、网络的结构设计(直接编码法、参数化编码法、繁衍生长法)和网络的分析

3.2.1 遗传算法基本处理过程:

遗传算法模拟自然选择机制,首先随机生成初始种群(每个个体代表一个解决方案),通过适应度函数评估个体优劣,然后进行选择(保留优秀个体)、交叉(交换个体特征)和变异(随机改变特征)操作产生新一代种群。这一过程反复迭代,直到满足终止条件(如达到最大迭代次数或找到满意解)。关键参数包括交叉率(通常60-90%)、变异率(通常1-5%)和种群规模(通常50-500个个体)。

3.2.2 网络学习优化:

遗传算法通过优化神经网络的权重参数和学习规则来提升网络性能。将每个权重组合编码为个体,使用测试集准确率作为适应度函数。通过选择、交叉和变异操作不断优化权重,特别适合解决传统梯度下降容易陷入局部最优的问题。

3.2.3 网络结构设计:

遗传算法可自动设计最优网络结构。采用直接编码法时,每个基因代表一层神经元数量;参数化编码法则定义生长规则。

3.2.4 网络分析优化:

遗传算法可分析网络特性并优化超参数。通过编码学习率、激活函数等超参数,算法能系统探索参数空间,找出最佳组合。同时,适应度函数可加入模型复杂度等约束,实现性能与效率的平衡,为网络分析提供新视角。

​​​​​​​4. BP算法(模型构建以及学习过程)

有具体数值能确定模型结构,就确定出来,没有就结合问题本身过程把训练数据输入到网络中得到实际的输出,实际输出与其期望的差值,体现出数据信息的正向传递,再根据误差,反向调节各种权重,调节过程是从输出层逐层传递到输出节点层,直到误差满足要求或迭代到一定次数。

学习过程:
①选择一组训练样例,每一个样例由输入信息和期望的输出结果两部分组成。

②从训练样例集中取一样例,把输入信息输入到网络中。

③分别计算经神经元处理后的各层节点的输出。

④计算网络的实际输出和期望输出的误差。

⑤从输出层反向计算到第一个隐层,并按照某种能使误差向减小方向发展的原则,调整网络中各神经元的连接权值。

⑥对训练样例集中的每一个样例重复步骤③~⑤,直到对整个训练样例集的误差达到要求时为止。

​​​​​​​4.1 请简要分析利用反向传播算法进行花卉分类的学习过程。

4.1.1 训练数据准备:

首先准备带有标注的花卉图像数据集,每张图像作为输入信息,对应的花卉类别作为期望输出结果。数据集按比例划分为训练集和测试集。输入图像通常需要预处理,如调整大小、归一化像素值等,使其符合网络输入要求。

4.1.2 前向传播过程:

将预处理后的花卉图像输入网络,数据依次通过各隐藏层进行特征提取和转换。每个神经元接收上层输出,经加权求和和激活函数处理后产生新输出。最终输出层给出网络对当前图像所属类别的预测概率分布。

4.1.3 误差计算:

比较网络输出与真实标签的差异,使用交叉熵等损失函数量化误差大小。实际输出与期望的差距即为当前误差,该误差反映了网络预测的准确程度。

4.1.4 反向传播调参:

误差信号从输出层反向传播,根据链式法则计算各层权重对总误差的贡献度。通过梯度下降算法,按贡献比例调整各层权重参数。靠近输出层的权重通常获得较大调整,而浅层权重更新较小,这种差异由反向传播自动确定。

4.1.5 迭代优化:

重复前向传播和反向传播过程,使用不同训练样本逐步优化网络参数。每次完整遍历训练集称为一个epoch,通常需要数十至数百个epoch才能使误差收敛到满意水平。训练过程中需监控验证集性能,防止过拟合。

4.1.6 训练终止:

当测试准确率达到预定阈值,或连续多个epoch性能不再提升时终止训练。最终保存的模型权重可用于新花卉图像的分类任务。

​​​​​​​​​​​​​​4.2 请简要分析利用反向传播算法进行手写体数字识别的学习过程。

​​​​​​​​​​​​​​4.2.1 训练数据准备:

首先加载手写数字数据集,包括输入图像和预期数字,其次将数据集随机划分为训练集和验证集,确保模型泛化能力。输入图像通常需要预处理,使其符合网络输入要求。

​​​​​​​​​​​​​​4.2.2 前向传播计算:

将预处理后的图像数据输入神经网络,数据依次通过输入层、隐藏层和输出层。每个神经元对其输入进行加权求和并通过激活函数处理,最终输出层产生10个类别的概率分布。

​​​​​​​​​​​​​​4.2.3 误差反向传播:

比较网络输出与真实标签的差异,使用交叉熵等损失函数量化误差大小。实际输出与期望的差距即为当前误差,该误差反映了网络预测的准确程度。

​​​​​​​​​​​​​​4.2.4 反向传播调参:

误差信号从输出层反向传播,根据链式法则计算各层权重对总误差的贡献度。通过梯度下降算法,按贡献比例调整各层权重参数。

​​​​​​​​​​​​​​4.2.5 迭代优化:

重复前向传播和反向传播过程,使用不同训练样本逐步优化网络参数。训练过程中需监控验证集性能,防止过拟合。

​​​​​​​​​​​​​​4.2.6 训练终止:

每次完整遍历训练集称为一个epoch,当测试准确率达到预定阈值,或连续多个epoch性能不再提升时终止训练。最终得到的手写数字识别模型在测试集上通常能达到99%左右的准确率。


如有问题或建议,欢迎在评论区中留言~

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐