笔记本难度:★★★★☆
机器学习是人工智能的一个分支,随着技术的发展,计算能力的提高而出现。它允许计算机通过利用输入数据集的内部结构来学习大量问题的结果。
机器学习 有三个主要设置 :
无监督学习 ——在无需任何先验知识的情况下学习给定数据集的内部结构。它通常用于在数据集中查找人眼可能无法察觉的有趣特征或相似之处。例如,在零售业中,它可用于聚合一组表现出相似购物模式的客户,以便向他们发送定向广告。
半监督学习 ——利用对给定数据集的一些了解来学习其内部结构。它通常用于能够区分类别和数据集的情况,而无需标记每个类别,这是一项昂贵的工作。例如,它可以用于异常检测场景,其中正常实例的数量通常远远高于异常实例。一个具体的例子是飞机故障检测,其中我们知道系统的正常运转,但我们缺乏异常,因为它可能太昂贵或很少发生(例如发动机故障)。在这种情况下,正常实例被标记,但异常实例没有。
监督学习 – 监督学习包括学习给定数据集中的模式,我们对该数据集有充分的理解。例如,有包含大量心律失常的 ECG 信号数据库,其中每个心跳都按心律失常类型或是否正常进行标记。
在这个 Jupyter Notebook 中,将展示如何使用 scikit-learn 包轻松部署机器学习模型来确定给定生物信号的性质,在本例中,它是 ECG 、 EMG 还是 其他 。