学习的过程,应该是增量学习的过程

增量学习与批量学习

Posted by Liu on April 7, 2020

学习的过程,应该是增量学习的过程

增量学习与批量学习

增量学习(Incremental Learning)是指一个学习系统在没有任何先验知识的情况下,对每次观测到的样本进行学习,进行数据更新,学到新的知识,而之前的知识保存在学习系统中,不需要重复处理。

改编自Robi Polikar的定义

增量学习和在线学习的思想其实很像,在这里我们不去探讨他们的区别。

我们人类的学习模式其实很类似于增量学习,从小学到大学,所学到的知识是阶梯式上升和波浪式前进着的,从某种角度上讲,我们应该对增量学习不感到陌生,并觉得很好理解。因为我们就是这么学习的。

而批量学习(Batch Learning),了解过机器学习的同学应该很清楚,即所有样本一次得到,分批训练,此后就不再学习了。我不知道这种学习模式怎么类比,可能类似于填鸭式的教育吧。初学者学习到的机器学习算法大部分都属于批量学习,当然数据量较小的话甚至不需要分批处理。

增量学习的应用

增量学习主要应用于大数据和流数据的处理,如web日志记录、天气数据等,这些数据要么非常大,甚至无法一次获取,要么就是有非常明显的随时间变化的趋势。

在大数据时代,生物医学大数据、工业互联网每天都在生成海量数据,传统的批量学习是不能满足需求的,通过增量学习,我们能更好地发挥大数据的优势。

增量学习的优缺点

增量学习的优点在于知识保存在学习系统中,不需要重新计算,充分利用之前所学的知识,而缺点也是由此产生,很容易产生过拟合或欠拟合的情况。

展望

通过对增量学习机制的模拟研究,或许能够反推人脑的奥秘,这与人工脑模型也或许有相互借鉴的地方。其实我记录下这篇博客,本身也是一种增量学习,知识改变了我的脑突触连接,将知识存储进我的学习系统里,在以后的学习中,不断改进我的学习表现,人类的进化或许也是由此产生的呢?

阅读了一些CSDN上博客,增量学习机器学习-增量训练方法对此他们表示感谢,这或许也可以看做数据的传递。