人机交互学习

人机交互课程学习

咔叽布吉

2220人浏览 · 2022-03-11 11:02:28

咔叽布吉 · 2022-03-11 11:02:28 发布

人机交互课程笔记

1.基础知识

1.概念

人机交互（Human-Computer Interaction ，HCI）是指关于设计、评估和实现供人们使用的交互式计算系统，并围绕相关现象进行研究的学科。

设计以人为本的软件。

2.交互范型（Form）

1.命令行交互：

基于字符的界面：用户通过在屏幕某个位置上键入特定命令的方式来执行任务。

优点：

专家用户能够快速完成任务；
较GUI节约系统资源；
可动态配置可操作选项；
键盘操作较鼠标操作更加精确；
支持用户自定义命令。

缺点：

命令语言的掌握对用户的记忆能力提出较高要求；
基于回忆的方式（recall memory）；
键盘操作，出错频率较高；
命令编写贴近计算机的执行方式。

2.菜单驱动界面：

以一组层次化菜单的方式提供用户可用的功能选项，一个或多个选项的选择可以改变界面的状态。

优点：

基于识别机制，对记忆的需求较低；
具有自解释性；
容易纠错；（命令行下，需要对用户输入进行解析）
适合新手用户。若提供了较好的快捷键功能，则对于专家用户同样适用。

缺点：

导航方式不够灵活；
当菜单规模较大时，导航效率不高；
占用屏幕空间，不适合小型显示设备；
对专家用户而言使用效率不高。

3.基于表格的界面

显示给用户的是一个表格，里面有一些需要用户填写的空格。

优点：

简化数据输入；
只需识别无需学习；
特别适合于日常文书处理等需要键入大量数据的工作。

缺点：

占用大量屏幕空间；
导致业务流程较形式。

4.直接操纵：用户通过在可视化对象上面进行某些操作来达到执行任务的目的。

三个阶段：

自由阶段——指用户执行操作前的屏幕视图；
捕获阶段——在用户动作（点击、点击拖拽等）执行过程中屏幕的显示情况；
终止阶段——用户动作执行后屏幕的显示情况。

优点：

将任务概念可视化，用户可以非常方便地辨别他们；
容易学习，适合新手用户；
基于识别，对记忆的要求不高，可减少错误发生；
支持空间线索，鼓励用户对界面进行探索；
可实现对用户操作的快速反馈，具有较高的用户主观满意度。

缺点：

实现起来比较困难；
对专家用户而言效率不高；
不适合小屏幕显示设备；
对图形显示性能的需求较高；
不具备自解释性，可能误导用户。

5.问答界面Wizard：

通过询问用户一系列问题实现人与计算机的交互。

优点：

对记忆的要求较低；
每个界面具有自解释性；
将任务流程以简单的线性表示；
适合新手用户。

缺点：

要求从用户端获得有效输入；
要求用户熟悉界面控制；
纠错过程可能比较乏味。

6.隐喻（Metaphor）界面：

在用户已有知识的基础上建立一组新的知识，实现界面视觉提示和系统功能之间的知觉联系，进而帮助用户从新手用户转变为专家用户。

优点：

直观生动，无需学习。

缺点：

不具有可扩展性
不同用户对同一事物可能产生不同的联想
紧紧地将我们的理念和物理世界束缚在一起
寻找恰当的隐喻可能存在困难

7.自然语言交互

3.理解用户

1.信息处理模型

研究人对外界信息的接收、存储、集成、检索和使用，可预测人执行特定任务的效率，如可推算人需要多长时间来感知和响应某个刺激（又称“反应时间”），信息过载会出现怎样的瓶颈现象等。

信息处理机

在这里插入图片描述

扩展的信息处理机模型

在这里插入图片描述

2.人脑中的记忆结构

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-EZVtp3NT-1646967577469)(C:\Users\颜霸灿烈\AppData\Roaming\Typora\typora-user-images\image-20220311104301608.png)]$

人类处理机模型

感知处理器：
信息将被输出到声音存储和视觉存储区域
认知处理器：
输入将被输出到工作记忆，同时可以访问工作记忆和长时记忆
动作处理器：
执行动作

存在的问题：

认知过程仅关注单人和单个任务，忽略了环境和他人的影响。

分布式认知模型：指认知分布于个体内、个体间、媒介、环境、文化、社会和时间等之中。

4.交互框架

提供理解或定义某种事物的一种结构；能够帮助人们结构化设计过程；认识设计过程中的主要问题；还有助于定义问题所涉及的领域。

单个目标可对应多个意图。

EEC模型

执行隔阂
用户为达目标而制定的动作与系统允许的动作之间的差别
评估隔阂
系统状态的实际表现与用户预期之间的差别

扩展EEC模型：EEC模型不能描述人与系统通过界面进行的通信

2.交互设计目标与原则

1.可用性目标：

不仅涉及人与之正在发生交互作用的系统，还包括系统对使用它的人所产生的作用。

易学性：对应开头
易记性：熟练用户到达学习曲线上平坦阶段时的稳定绩效水平
少出错：保证错误发生后迅速恢复到正常状态
高效率
主观满意度

在这里插入图片描述

2.简单可用性工程

可用性属性的度量：易学性、使用效率度量、易记性度量、错误率度量、满意度度量

四项关键技术：用户和任务观察、场景、简化的边做边说、启发式评估

3.设计原则：

一般规则：可学习性、灵活性、健壮性

可学习性：
在这里插入图片描述
灵活性：

健壮性：

在这里插入图片描述

黄金规则：

尽可能保证一致
符合普遍可用性
提供信息丰富的反馈
设计说明对话框以生成结束信息
预防并处理错误
让操作容易撤销
支持内部控制点
减轻短时记忆负担

启发式规则

系统状态的可见度
系统和现实世界的吻合
用户享有控制权和自主权
一致性和标准化
避免出错
依赖识别而非记忆
使用的灵活性和高效性
审美感和最小化设计
帮助用户识别、诊断和恢复错误
帮助和文档

3.交互需求定义

1.需求背景

需求：指定产品应该做什么，或应该怎么做。

2.产品特性

功能不同、物理条件不同、使用环境不同

3.用户特性

体验水平差异、年龄差异、文化差异、健康差异

4.用户建模

5.需求获取

人物角色+场景剧本=需求

6.任务分析

记录人们如何完成任务；

层次化任务分析（HTA），分级子任务。

7.需求验证

原型

4.交互式系统的设计

1.设计框架

1.定义外形因素和输入方法；

2.定义数据和功能元素；

3.决定功能组合层次；

4.勾画大致的设计框架；

5.构建关键情景场景剧本；

6.通过验证性的场景剧本来检查设计；

2.设计策略

1.简化设计：隐藏、组织、删除

删除不必要的；组织要提供的；隐藏非核心的。

2.设计折中：

个性化与配置；
本地化和国际化；
审美学与实用性。

3.设计细节：

加快系统的响应时间；
减轻用户的记忆负担；
减少用户的等待感；
设计好的出错信息；

3.交互设计模式

设计解决问题的方法

5.交互设计模型与理论

1.预测模型

能够预测用户的执行情况，但不需要对用户做实际测试。

GOMS

是关于人类如何执行认知—动作型任务以及如何与系统交互的理论模型，采用“分而治之”的思想，将一个任务进行多层次的细化。

Goal目标：用户要达到的目的（动作-对象）
Operator操作：不可分解的基本动作，操作时间上下文无关。
Method方法：如何完成目标的过程，实现目标所需要的操作序列
Selection选择规则：有多种方法时选择不是随机的

优点：

能够容易地对不同的界面或系统进行比较分析

局限性 ：

假设用户完全按一种正确的方式进行人机交互，没有清楚地描述错误处理的过程
只针对那些不犯任何错误的专家用户
任务之间的关系描述过于简单
忽略了用户间的个体差异

四种GOMS模型：

击键层次模型KLM
CMN GOMS
NGOMSL
CPM GOMS

KLM

对用户执行情况进行时间上的量化预测；基于无错误的情况。

操作符：

K表示按下一个物理键=0.28s；P代表鼠标指向电脑屏幕上的某个位置=1.10s；H是指手移向键盘的初始位置=0.40s；M是认知操作符，表示执行动作前的认知准备时间=1.35s；R是系统响应操作符，记录等待系统响应时间。

放置M的启发式规则：

所有的K（击键）之前插入M，在所有用于命令选择的P之前插入M，但是对于选择命令参数的p不要插入M；
删除可以预知的M；
如果一串MK组成的字符串是一个认知单元，则删除第一个M外的所有M；
删除认知单元后多余的K（分隔符）之前的M；
删除与R重叠的M；
如果K是分隔符且后面紧跟一个常量字符串，则删除M。

Fitts定律

描述了人类运动系统的信息量

2.动态特性建模

1.状态转移网：用于描述用户和系统之间的对话；

状态转移图：有向图，结点表示系统状态，边表示状态之间可能的转移。

2.三态模型（Three-State Model）：将指点设备的操作使用状态转移来表示：

无反馈运动
跟踪运动
拖动运动

3.语言模型

用户和计算机的交互通常是通过一种语言进行考察的；BNF语法常用于说明对话，目的在于理解用户的行为和分析认知界面的难度。

4.系统模型

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

【计算机视觉】Pixel逐像素分类&Mask掩码分类理解摘要

魔乐社区

计算机视觉（opencv）实战三十二——CascadeClassifier 人脸微笑检测（摄像头）

本文从原理到实现，详细介绍了基于 OpenCV Haar 分类器的人脸与微笑检测：讲解了 Haar 特征和级联检测原理。对代码逐行拆解并解释参数含义。画出完整流程图，帮助理解执行过程。给出了常见问题和优化建议，甚至扩展到深度学习方法。这种方法简单、轻量、实时性好，非常适合入门和小型应用项目。但如果需要更高准确率和更强鲁棒性，建议使用深度学习检测器替代 Haar 分类器。