机器学习这么火 你可知道它有哪些常见技术?
对于机器学习而言,并不存在“一体适用”的说法。构建不同的模型需要用到不同的算法和不同技术,但如何才能确定哪种技术最合适呢?
机器学习并不局限于一套具体的算法,它依赖于你想要达到的目标,或者说依赖于数据类型和数据量。
以下是机器学习中一些常见的技术:
监督式学习
数据是否被贴上标签,决定了它是被监督还是无人监督的。监督学习使用人类标记过的数据,通常在数据有能力预测可能发生的事件时使用。换句话说,在我们知道自己需要得到什么样的结果输出时,所输入数据就是这些标记过的数据。该算法对一组输入数据进行处理,并得到相应的输出结果,通过将该输出结果与正确结果进行比较来发现错误。一旦发现错误,就可以相应地对模型进行修改。
分类
分类属于监督学习,可以定义为尝试预测给定输入的输出结果。分类采用一组未知的实体,将其识别为更大的已知组。为了进行学习,它需要一组已标记的实例,例如图像、文本或语音。随着训练次数的增长,使分类器达到高准确度所需的数据量可能很大,达到数千甚至数百万个实例。虽然分类通常针对简单的类别,但它可以扩展到目标是一个结构或一个序列的情况,就像自然语言处理一样。
无监督学习
无监督学习使用无标记的数据。在这种情况下,机器在不了解任何事先数据或信息的情况下发现了新的模式。当数据被归类到类似的数据组时,这种类型的学习会在集群下很好地工作。
强化学习
受强化行为心理观念的启发,强化学习是一种学习的理念。机器可以通过多次尝试和错误来获得一个理想的结果。随着时间的推移,它学会了选择某种行为,以得到理想的结果。这种类型的学习经常被应用于游戏、导航等应用程序中。
神经网络
深度神经网络(DNNs),又称人工神经网络(ANN),代表了一套用于构建强大的学习系统的技术。与某些算法不同,它们添加了一些“隐藏”层,用于提取中间表示。这种技术于20世纪80年代被发明,在2010年之后开始腾飞,这种飞速增长得益于强大的并行硬件和易于使用的开源软件。
DNNs覆盖了一系列不同的神经体系结构,最著名的是:
递归神经网络(RNN)——神经元将反馈信号发送给彼此
卷积神经网络(CNN)——前馈神经网络,通常用于视觉和图像识别
TAG:IT168企业级 |