人机交互学习
人机交互课程学习
人机交互课程笔记
1.基础知识
1.概念
人机交互(Human-Computer Interaction ,HCI)是指关于设计、评估和实现供人们使用的交互式计算系统,并围绕相关现象进行研究的学科。
设计以人为本的软件。
2.交互范型(Form)
1.命令行交互:
基于字符的界面:用户通过在屏幕某个位置上键入特定命令的方式来执行任务。
优点:
- 专家用户能够快速完成任务;
- 较GUI节约系统资源;
- 可动态配置可操作选项;
- 键盘操作较鼠标操作更加精确;
- 支持用户自定义命令 。
缺点:
- 命令语言的掌握对用户的记忆能力提出较高要求;
- 基于回忆的方式(recall memory);
- 键盘操作,出错频率较高;
- 命令编写贴近计算机的执行方式。
2.菜单驱动界面:
以一组层次化菜单的方式提供用户可用的功能选项,一个或多个选项的选择可以改变界面的状态 。
优点:
- 基于识别机制,对记忆的需求较低;
- 具有自解释性;
- 容易纠错;(命令行下,需要对用户输入进行解析)
- 适合新手用户。若提供了较好的快捷键功能,则对于专家用户同样适用。
缺点:
- 导航方式不够灵活;
- 当菜单规模较大时,导航效率不高;
- 占用屏幕空间,不适合小型显示设备;
- 对专家用户而言使用效率不高。
3.基于表格的界面
显示给用户的是一个表格,里面有一些需要用户填写的空格 。
优点:
- 简化数据输入;
- 只需识别无需学习;
- 特别适合于日常文书处理等需要键入大量数据的工作 。
缺点:
- 占用大量屏幕空间;
- 导致业务流程较形式。
4.直接操纵:用户通过在可视化对象上面进行某些操作来达到执行任务的目的。
三个阶段:
- 自由阶段——指用户执行操作前的屏幕视图;
- 捕获阶段——在用户动作(点击、点击拖拽等)执行过程中屏幕的显示情况;
- 终止阶段——用户动作执行后屏幕的显示情况。
优点:
- 将任务概念可视化,用户可以非常方便地辨别他们;
- 容易学习,适合新手用户;
- 基于识别,对记忆的要求不高,可减少错误发生;
- 支持空间线索,鼓励用户对界面进行探索;
- 可实现对用户操作的快速反馈,具有较高的用户主观满意度。
缺点:
- 实现起来比较困难;
- 对专家用户而言效率不高;
- 不适合小屏幕显示设备;
- 对图形显示性能的需求较高;
- 不具备自解释性,可能误导用户。
5.问答界面Wizard:
通过询问用户一系列问题实现人与计算机的交互。
优点:
- 对记忆的要求较低;
- 每个界面具有自解释性;
- 将任务流程以简单的线性表示;
- 适合新手用户。
缺点:
- 要求从用户端获得有效输入;
- 要求用户熟悉界面控制;
- 纠错过程可能比较乏味。
6.隐喻(Metaphor)界面:
在用户已有知识的基础上建立一组新的知识,实现界面视觉提示和系统功能之间的知觉联系,进而帮助用户从新手用户转变为专家用户。
优点:
直观生动,无需学习。
缺点:
- 不具有可扩展性
- 不同用户对同一事物可能产生不同的联想
- 紧紧地将我们的理念和物理世界束缚在一起
- 寻找恰当的隐喻可能存在困难
7.自然语言交互
3.理解用户
1.信息处理模型
研究人对外界信息的接收、存储、集成、检索和使用,可预测人执行特定任务的效率,如可推算人需要多长时间来感知和响应某个刺激(又称“反应时间”),信息过载会出现怎样的瓶颈现象等。
信息处理机
扩展的信息处理机模型
2.人脑中的记忆结构
人类处理机模型
感知处理器 :
信息将被输出到声音存储和视觉存储区域
认知处理器 :
输入将被输出到工作记忆,同时可以访问工作记忆和长时记忆
动作处理器 :
执行动作
存在的问题:
认知过程仅关注单人和单个任务,忽略了环境和他人的影响。
分布式认知模型:指认知分布于个体内、个体间、媒介、环境、文化、社会和时间等之中。
4.交互框架
提供理解或定义某种事物的一种结构;能够帮助人们结构化设计过程;认识设计过程中的主要问题;还有助于定义问题所涉及的领域。
单个目标可对应多个意图。
EEC模型
执行隔阂
用户为达目标而制定的动作与系统允许的动作之间的差别
评估隔阂
系统状态的实际表现与用户预期之间的差别
扩展EEC模型:EEC模型不能描述人与系统通过界面进行的通信
2.交互设计目标与原则
1.可用性目标:
不仅涉及人与之正在发生交互作用的系统,还包括系统对使用它的人所产生的作用。
- 易学性:对应开头
- 易记性:熟练用户到达学习曲线上平坦阶段时的稳定绩效水平
- 少出错:保证错误发生后迅速恢复到正常状态
- 高效率
- 主观满意度
2.简单可用性工程
可用性属性的度量:易学性、使用效率度量、易记性度量、错误率度量、满意度度量
四项关键技术:用户和任务观察、场景、简化的边做边说、启发式评估
3.设计原则:
- 一般规则:可学习性、灵活性、健壮性
可学习性:
灵活性:
健壮性:
- 黄金规则:
-
尽可能保证一致
-
符合普遍可用性
-
提供信息丰富的反馈
-
设计说明对话框以生成结束信息
-
预防并处理错误
-
让操作容易撤销
-
支持内部控制点
-
减轻短时记忆负担
- 启发式规则
- 系统状态的可见度
- 系统和现实世界的吻合
- 用户享有控制权和自主权
- 一致性和标准化
- 避免出错
- 依赖识别而非记忆
- 使用的灵活性和高效性
- 审美感和最小化设计
- 帮助用户识别、诊断和恢复错误
- 帮助和文档
3.交互需求定义
1.需求背景
需求:指定产品应该做什么,或应该怎么做。
2.产品特性
功能不同、物理条件不同、使用环境不同
3.用户特性
体验水平差异、年龄差异、文化差异、健康差异
4.用户建模
5.需求获取
人物角色+场景剧本=需求
6.任务分析
记录人们如何完成任务;
层次化任务分析(HTA),分级子任务。
7.需求验证
原型
4.交互式系统的设计
1.设计框架
1.定义外形因素和输入方法;
2.定义数据和功能元素;
3.决定功能组合层次;
4.勾画大致的设计框架;
5.构建关键情景场景剧本;
6.通过验证性的场景剧本来检查设计;
2.设计策略
1.简化设计:隐藏、组织、删除
删除不必要的;组织要提供的;隐藏非核心的。
2.设计折中:
- 个性化与配置;
- 本地化和国际化;
- 审美学与实用性。
3.设计细节:
- 加快系统的响应时间;
- 减轻用户的记忆负担;
- 减少用户的等待感;
- 设计好的出错信息;
3.交互设计模式
设计解决问题的方法
5.交互设计模型与理论
1.预测模型
能够预测用户的执行情况,但不需要对用户做实际测试。
GOMS
是关于人类如何执行认知—动作型任务以及如何与系统交互的理论模型,采用“分而治之”的思想,将一个任务进行多层次的细化。
- Goal目标:用户要达到的目的 (动作-对象)
- Operator操作:不可分解的基本动作,操作时间上下文无关。
- Method方法:如何完成目标的过程,实现目标所需要的操作序列
- Selection选择规则:有多种方法时选择不是随机的
优点:
能够容易地对不同的界面或系统进行比较分析
局限性 :
- 假设用户完全按一种正确的方式进行人机交互,没有清楚地描述错误处理的过程
- 只针对那些不犯任何错误的专家用户
- 任务之间的关系描述过于简单
- 忽略了用户间的个体差异
四种GOMS模型:
- 击键层次模型KLM
- CMN GOMS
- NGOMSL
- CPM GOMS
KLM
对用户执行情况进行时间上的量化预测;基于无错误的情况。
操作符:
K表示按下一个物理键=0.28s;P代表鼠标指向电脑屏幕上的某个位置=1.10s;H是指手移向键盘的初始位置=0.40s;M是认知操作符,表示执行动作前的认知准备时间=1.35s;R是系统响应操作符,记录等待系统响应时间。
放置M的启发式规则:
- 所有的K(击键)之前插入M,在所有用于命令选择的P之前插入M,但是对于选择命令参数的p不要插入M;
- 删除可以预知的M;
- 如果一串MK组成的字符串是一个认知单元,则删除第一个M外的所有M;
- 删除认知单元后多余的K(分隔符)之前的M;
- 删除与R重叠的M;
- 如果K是分隔符且后面紧跟一个常量字符串,则删除M。
Fitts定律
描述了人类运动系统的信息量
2.动态特性建模
1.状态转移网:用于描述用户和系统之间的对话;
状态转移图:有向图,结点表示系统状态,边表示状态之间可能的转移。
2.三态模型(Three-State Model):将指点设备的操作使用状态转移来表示:
- 无反馈运动
- 跟踪运动
- 拖动运动
3.语言模型
用户和计算机的交互通常是通过一种语言进行考察的;BNF语法常用于说明对话,目的在于理解用户的行为和分析认知界面的难度。
4.系统模型

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐
所有评论(0)