Collect from 银星围棋

李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然

  人工智能,几经波折,起起落落。2016年3月,AlphaGo在围棋领域击败了韩国顶尖棋手李世石之后,它的热度又一次被点燃,瞬间成为了家喻户晓的科技明星。


李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然


  那么类似这种棋谱策略游戏方面的人工智能,它是什么样的技术呢?


  首先,小编为大家介绍一下人工智能这一概念。


李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然


  人工智能(Artificial Intelligence),即AI,它是计算机科学的一个分支,它是研究、研发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。


李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然


  它企图了解智能的本质,并且能以人类的智能方式做出反应的智能机器,该领域的研究包括语音识别、图像识别、自然语言处理等。


李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然


  人工智能的概念比较宽泛,它包括机器学习和深度学习,并且每次技术的变革都是在解决相关智能技术遇到的瓶颈问题。


李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然


  比如:深度学习在机器学习的基础上引入了神经网络,它可以自动学习特征和任务之间的关联,还能从简单特征中提取复杂的特征,这样就解决了传统机器学习特征提取问题难的弊端。


李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然


  今天小编主要给大家介绍几种机器学习的算法,为以后的深度学习打基础:


  算法一:逻辑回归(Logistic Regression, LR)


  它为逻辑回归分析,是分类和预测算法中的一种。采用的是监督学习的方式,通过分析历史数据特征来对未来事件发生的概率进行预测。


李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然


  代表函数是sigmoid函数,它具有我们需要的一切优美特性,其定义域在全体实数,值域在[0, 1]之间,并且在0点值为0.5。公式如下:


李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然


李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然


  那么,如何将f(x)转变为sigmoid函数呢?


  设p(x)=1即为表示具有特征x的样本被分到类别1的概率,那么p(x)/[1-p(x)]则被定义为让步比(odds ratio)。


  为了解除p(x),则引入对数:


李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然


  那么可得:


李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然


  此时的p(x)这就是需要的sigmoid函数。如果要机器学习,那么根据已知数据,拟合出该式中n个参数c即可。


  算法二:决策树


  它的思想是:寻找一种算法,计算机可以根据该算法完成像if-else结构一样从根开始不断判断选择到叶子节点的树,这样的树就称为决策树。


  该方法的重点就在于如何从这么多的特征中选择出有价值的,并且按照最好的顺序由根到叶。


李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然


  信息增益则是最常见的算法之一。它划分数据集的规则是将无序的数据变得更加有序。它涉及到信息的有序无序问题,那么就要考虑信息熵(另一种方法是基尼不纯度)了。


  熵在信息论中代表随机变量不确定度的度量。一个离散型随机变量 X的熵 H(X)定义为:


李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然


  P(x),i=1,2,…,X为信源取第i个符号的概率


  信息熵用来衡量信息量的大小:


  若不确定性越大,则信息量越大,熵越大;


  若不确定性越小,则信息量越小,熵越小。


  比如我们要计算“夏天下雪”这个事件的信息熵,这个信息量很大,那么熵也很大。


李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然


  该算法计算复杂度不高,输出结果易于理解,对中间值缺失不敏感,可以处理不相关的特征数据,它是一种非参数的监督式学习的方法,常常用于分类和回归。


李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然


  情况三:朴素贝叶斯


  在机器学习分类算法中,朴素贝叶斯和绝大多数的分类算法不同。


  例如:逻辑回归(LR),svm,决策树,KNN等等,这些都是判别方法。


  他们是直接学习出特征输出Y和特征X之间的关系:决策函数Y = F(X)或条件分布P(Y|X),然而朴素贝叶斯是生成方法,它直接找出特征输出Y和特征X的联合分布P(X,Y),则可知:P(Y|X) = P(X,Y)/P(X)


  首先回顾一下朴素贝叶斯相关的统计学知识:


  贝叶斯的思想可以等效为:先验概率+数据=后验概率。


  一般来说先验概率就是我们对于数据所在领域的历史经验,但是这个经验常常难以量化或者模型化,那么我们可以假设先验分布的模型,比如正态分布,高斯分布等。


  假如X和Y相互独立,则有:


李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然


  假如X和Y不相互独立,则公式:


李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然


  Or:


李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然


  那么,则有全概率公式:


李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然


  从上面的公式很容易得出贝叶斯公式:


李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然


  该算法在scikit-learn中,一共有3个朴素贝叶斯的分类算法类。


  它们分别是GaussianNB,BernoulliNB和MultinomialNB。


  其中:


  1)GaussianNB表示先验为高斯分布的朴素贝叶斯;


  2)BernoulliNB表示先验为伯努利分布的朴素贝叶斯;


  3)MultinomialNB表示先验为多项式分布的朴素贝叶斯。


  这三个类适用的分类场景各不相同,一般来说:


  1)假如样本特征的分布绝大部分是连续值,使用GaussianNB;


  2)假如样本特征是二元离散值或者很稀疏的多元离散值,则BernoulliNB;


  3)假如样本特征的大部分是多元离散值,使用MultinomialNB。


  总之在很多实际应用中,贝叶斯理论很好用,比如垃圾邮件分类,文本分类。


李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然


  总之机器学习算法是构架深度学习神经网络的基础,只有我们打好了基础,我们才能更好的学习,深度学习的精髓。


李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然


  最后小编推荐,DeepMind团队和暴雪公司给大家提供了基于星际争霸II的强化学习环境SC2LE,它提供一个开源的Python界面,用于与游戏引擎进行通信,据相关的强化学习算法构造一个基于游戏行为的控制策略。希望大家体验下。




李世石

热点追踪

View All NEWS and event