2023湖南师大机器人与人工智能期末复习总结
2023湖南师大机器人与人工智能期末复习总结,由博主结合相关资料进行总结,应对小老头残酷期末考试,并造福广大同学。
第一章 人工智能概述
什么是人工智能?
让计算机系统模拟或应用人类智能,执行复杂任务的能力;
人工智能分类
- 通用人工智能: 例如科幻小说中具备全部甚至超越人类智能的机器人
- 实用人工智能 :以实现单一任务或少量任务为目标的特定智能系统
人工智能研究领域
自然语言处理
处理人与计算机之间用自然语言进行有效通信的理论与方法。
计算机视觉
给机器装上眼睛,并赋予其分析所见的能力。
知识表示
知识表示:是一种计算机可以接收的用于描述知识的数据结构。常用的知识表示方法 主要包括一阶谓词逻辑表示法、产生式表示法、框架表示法、语义网络表示法。
产生式表示法:又称为产生式规则表示法,常用于表示事实、规则以及他们的不确定性度量。基于某种固定的模板(例如 if then, 例如三元组)去产生 人类经验规则 及掌握的客观事实。优点:简单、易用、解释性强。缺点:条条框框仅能表示有限的规则性知识、适合过程性知识表示。 不能表示结构性知识(结构:知识间的关联与区别)。
语义网络:一种用实体及其语义关系来表示知识的有向图,语义网络中的基本语义单元:语义基元。优点:结构性、联想性。缺点:复杂性。
模式识别
模式是自然或者真实世界物体所呈现的最原始形式,模式识别就是根据物体呈现,识别出物体的某种属性。如:语音识别、人脸识别、文字识别。
从人类认知科学角度:研究人类模式识别机理
从计算机角度:研究让计算机实现特定模式识别任务
机器学习
学术定义:让机器从已有数据学习掌握知识,识别现有知识各种变体
人工神经网络
模拟人脑神经系统对复杂信息处理的一种数学模型,由大量的简单神经元相互连接形成复杂的网络,理论上可以近似任意非线性函数。
智能控制
人工智能+自动控制+运筹学 的智能控制三元论(傅京孙)
力矩控制:控制力道恰到好处,不至于捏碎
机械臂轨迹控制:控制机械臂轨迹,精准到达人手
人工智能主要争论
伦理和道德问题、超级智能的担忧
总结
- 从功能性任务或应用出发:自然语言处理、视觉分析、模式识别
- 从支撑任务实现的技术角度出发:知识表示、机器学习、神经网络、智能控制
- 主要争论:超级人工智能带来的社会问题冲击
第二章 机器学习
机器学习基础
学术定义
让机器从已有数据学习掌握知识,识别现有知识各种变体
常见学习任务
分类:给定某一数据,让机器学会对其某一属性正确分类。如:图像分类,应用:机器人目标识别、机器人文字阅读
回归:?。如:图像修复(输出0-255的灰度),应用:机器人视觉超分辨率
区分:分类问题的输出一般是几个固定的离散值;回归问题的输出则是某一区间连续值。
基本术语
- 数据集:多个对象或样本客观描述构成的集合且该描述通常与所需要学习的任务(如西瓜好坏分类)直接相关(机器学习的基础)
- 样本:数据集中的每一个对象
- 特征向量:计算机中对某一对象或某一样本属性的数值化
- 特征空间:将各特征属性视为坐标轴形成的坐标空间
- 训练或学习:从数据集中 学得模型的过程即为“训练”也即学习本身
- 训练集、测试集、验证集:?
- 泛化:机器学习模型的对于同类型不同样本的通用能力即泛化
- 有监督学习:每个样本包含特征描述,且均对应有其真值
- 无监督学习:每个样本仅有特征描述
- 聚类分析:让机器模拟人的无监督归类过程
- 特征降维:让机器学习剔除冗余的特征维度
学习评估
拟合
过拟合:学习了过多训练样本独有特点导致的泛化误差
欠拟合:未能学习到训练集的一般规律泛化误差大
机器学习的评估:泛化误差越小越好
评估量化标准
常见分类模型与原理
机器学习常用分类模型
- K-nearest neighbor **-**最近邻分类
- **Linear Classifier-**线性分类器
- Logistic regression-逻辑回归
- SVM-支持向量机
- **Naïve Bayes-**朴素贝叶斯
- Randomized Forests-随机森林
- Neural networks-神经网络
最近邻分类( K-nearest neighbor )
线性分类器( Linear Classifier)
支持向量机( Support Vector Machine)
贝叶斯分类
为什么叫生成:有了特征分布,意味着可以任意采样,从而生成新的样本
第三章 神经网络与深度学习
神经网络基础
神经元:大脑信息处理与传递的基本单元,神经元之间通过一种特殊的电信号传递信息。
根据神经元之间的连接形式划分,可分为:
- 多层前馈神经网络
- 递归神经网络
多层前馈神经网络
前馈:即所有神经元信息仅瞄准一个固定前进方向走
递归神经网络RNN
RNN:用于处理多个样本组成的整体序列(可以看做一个整体样本)且各样本之间存在相互依赖
与前馈型的区别:
- 前馈型信息仅利用一次
- 递归型信息可递归重复利用
常规RNN缺点:
- 不经筛选:短时间,无用干扰信息增多
- 不经筛选:长时间,关键信息被淹没
长短时记忆网络LSTM
- 遗忘门:剔除已经无用的历史关键信息
- 输入门:普通RNN处理后的输出相乘,根据当前特征与历史特征 甄选出当前的关键信息
- 输出门:更新完毕的关键信息相乘,从更新后的关键信息中筛选 下次递归的历史特征
总结
- 最小单元一般是“特征组合+激活函数”的神经元
- 通过网络样本展开可找到递归神经网络无回路的传播路径,从而实现损失的反向传播
- 对于分类任务,一般用交叉熵损失
深度学习基础
卷积神经网络(CNN)
深度学习图像识别
AlexNet
与90年底LeNet
结构无本质区别,只是更深、更宽。
深度学习目标检测
深度学习语义分割
自然语言处理
文本处理
第四章 机器人基础
机器人定义
- 维基百科:机器人是自动控制机器的俗称,自动控制机器包括一切模拟人类行为或思想以及模拟其他生物的机械
- 美国国家标准局:机器人是一种能够进行编程并在自动控制下执行某些操作和移动作业任务的机械装置
机器人类型
- 工业机器人:代替人类从事重复、规律性工业作业的机器人,多数时候以机械臂形式呈现,以汽车行业最为成熟
- 服务机器人:代替人类从事服务性工作的机器人,部分具备一定“人”形形态
- 特种机器人:代替人类从事危险特种作业的机器人
- 医疗机器人:代替人类从事医疗手术等作业的机器人
- 人形机器人:与人类外形、行为高度相似的机器人
智能机器人
一般的:智能代表具备处理”未知”情况的能力
机器人感知
机器人传感器:机器人感知自身状态的内部传感器
- 计算机视觉:仅关注通用的视觉信息处理、不关注视觉信息从哪来
- 机器视觉:感知主体设计+视觉信息处理+处理后的应用
- 机器听觉:感知主体设计+听觉信息处理+处理后的应用
- 机器触觉:感知主体设计+触觉信息处理+处理后的应用
机器人规划与决策
路径规划:规划出一条移动路径,让机器人从起始点到终点成本最小
任务规划:根据任务需求,合理分解子任务,并判断任务优先级,规划任务流程
第五章 机器人定位与地图创建
定位
- 卫星定位
- 无线局域网定位
建图
- 结构化地图信息:每个物理坐标位置”有”唯一确定的节点信息
- 地图创建:将所看到的当前信息,存入指定物理坐标的过程
SLAM
常用地图形式
- 2D栅格地图:仅记录某位置有无障碍信息的地图,常见使用对象:扫地机器人
- 3D点云地图:本质上对场景的3维重构,常见使用对象:人形机器人、无人驾驶
里程计(相对定位)
视觉里程计的目标:根据相邻图像信息,获得旋转矩阵与平移向量
后端优化
接受不同时刻视觉里程计测量的相机位姿,对当前拼接进行优化和调整
回环检测
第六章 机器人路径规划与导航
机器人路径规划
定义:为机器人的移动规划一条可行的路径
传统方法:构形空间法
构形空间的每点表示机器人的一种构形(Configuration或者状态),而构形则是用来完整描述机器人完整状态的一种数据,构形空间属于欧式空间