Deep learning model - china classification
对于中国古代瓷器我一直有着浓厚的兴趣,对于瓷器的鉴别我并不能算很懂,全部经验主要来自于几本中国陶瓷鉴赏和马未都老师的瓷之色,瓷之纹等等,再加上从小便穿梭于北京潘家园的陶瓷市场,所以遇到一些典型器件,到也可以说上几句。
对于现有的deep learning 模型,对于整体形状的描述的classification, detection都取得了远高于传统computer vision的成绩。即使的2012年就已经出现的alex net 在很多方面也可以轻松取得 90% 以上的training success rate。但是,由于陶瓷在纹路上差别细微,器型和颜色的使用又不是局限于某朝某代。所以准确鉴别中国古代陶瓷就成为了一件十分有趣且具有挑战的项目。
经过整理truth data和阅读一些陶瓷鉴别典籍, 我们决定从以下几个方面来开始这个project:
1. 器型:
器型应该是最容易区别的,因为形状的差异在图片的表现上特征十分明显, 通过和年代的数据做对比,我们可以首先将不同年代出现的器型进行归类整理,大体器型有79种,对应年代13种。
2. 釉色
釉色的差别并没有器型那么明显,但由于低温釉,高温釉的工艺差别,我们同样也将不同釉色与其对应的年代归类整理,大体釉色12种,对应年代13种。
3. 纹饰
纹饰本是可以区分朝代的一项重要指标,因为有些纹饰仅出现在某些朝代,但由于同一属性纹饰数据量的缺乏,使得整理这一方面的truth data 困难重重。
4. 技法
技法是另一个重要指标,由于他可以明显区别不同的朝代,所以在最后的判定上也起到了十分关键的作用。我们甚至可以在已有的deep learning model 基础上使用fine tuning来实现对于技法的classification, 基本技法22种,对应年代13种。
不过开始前,先让我们来用deep learning model 直接对这个问题做一下classification。为了简单起见我们总结了3个临近朝代(宋,明,清)来做这项实验。每个朝代我们准备了170张相关联的图片,其中包含了各种不同器型,釉色,纹饰和技法。
1. created database:
2. 使用我们修改过后3层fully connected layer的deep learning model 来做classification,如下图。
即使是这种native 的方法,我们可以得到将近75%的success rate, 但随着数据量的增大,training loss 和 test loss 都不再降低了,说明即使有更多的data, 这种方法也是很难达到我们所期望的准确率的。
让我们再用一张新图来测试一下这个系统:
为了简化起见,这里省略掉其他 5个layer的数据, 和后面3个fully connected layer数据, 直接给出了最后一层fully connected layer 数据, 大家可以看出,这其中的计算参数高达5688万。
最后,我们得到了classification的结果,这个结果是正确的,这说明即使不使用任何策略,仅仅依靠修改基本的deep learning 模型,我们也可以得到一个decent结果,虽然这个结果不能够达到我们所期望的值。但他也从侧面证明了,不同朝代瓷器间确实有其独特之处。再使用了我们所谈到的分类classification 后,其特点将被充分凸显,我们相信其结果会更加精准。