fashion_mnist_demo

fashion_mnist_demo

mnist的手写数字识别数据集一直是各种机器学习算法的试金石之一,最近有个新的数据集要向它叫板,称为fashion-mnist,内容是衣服鞋帽等分类。为了便于用户往fashion-mnist迁移,作者把数据集做成了几乎跟mnist手写数字识别数据集一模一样——同样数量、尺寸的图片,同样是10分类,甚至连数据打包和命名都跟mnist一样。看来fashion mnist为了取代mnist,也是拼了,下足了功夫,一切都做得一模一样,最大限度降低了使用成本~这叫板的心很坚定呀。

叫板的原因很简单——很多人吐槽,如果一个算法在mnist没用,那就一定没用了,但如果一个算法在mnist上有效,那它也不见得在真实问题中有效~也就是说,这个数据集太简单,没啥代表性。

fashion-mnist的github:https://github.com/zalandoresearch/fashion-mnist/
公众号的介绍:《取代MNIST?德国时尚圈的科学家们推出基准数据集,全是衣裤鞋包》

fashion-mnist共有10个类,分别是:T-shirt/top、Trouser、Pullover、Dress、Coat、Sandal、Shirt、Sneaker、Bag、Ankle boot。不少人都在跑实验,看把原来在mnist奏效的模型直接搬到这个新的数据集的效果如何~这里已经有一些benchmark可以参考了。

我也来凑了个热闹,把之前在mnist有效的wgan-gp代码(请看《互怼的艺术:从零直达WGAN-GP》)在这个数据集跑了一遍,发现还是work的。用法很非常简单,只需要改一下路径即可~

代码:https://github.com/bojone/gan/blob/master/fashion_mnist_gangp.py

使用方法

git clone https://github.com/zalandoresearch/fashion-mnist.git
cd fashion-mnist
wget https://raw.githubusercontent.com/bojone/gan/master/fashion_mnist_gangp.py
python fashion_mnist_gangp.py

对比原来的文件,就只改动了路径。在当前目录下的out目录,可以看到逐渐生成的样本,越来越清晰,并越来越多样化~当然,跟原图差距还是有的,估计是模型容量不足的问题,大家可以自行折腾,笔者仅是抛砖引玉了。

部分生成样本(顺序:从左往右,从上往下。可以发现,中间有个过程图片会变得比之前更模糊,但可以发现之后图片就更加多样化了。):

fashion_mnist_gan_1

fashion_mnist_gan_1

fashion_mnist_gan_2

fashion_mnist_gan_2

fashion_mnist_gan_3

fashion_mnist_gan_3

fashion_mnist_gan_4

fashion_mnist_gan_4

fashion_mnist_gan_5

fashion_mnist_gan_5

fashion_mnist_gan_6

fashion_mnist_gan_6

转载到请包括本文地址:https://spaces.ac.cn/archives/4540

更详细的转载事宜请参考:《科学空间FAQ》

如果您还有什么疑惑或建议,欢迎在下方评论区继续讨论。

如果您觉得本文还不错,欢迎分享/打赏本文。打赏并非要从中获得收益,而是希望知道科学空间获得了多少读者的真心关注。当然,如果你无视它,也不会影响你的阅读。再次表示欢迎和感谢!

如果您需要引用本文,请参考:

苏剑林. (Aug. 26, 2017). 《fashion-mnist的gan玩具 》[Blog post]. Retrieved from https://spaces.ac.cn/archives/4540

@online{kexuefm-4540,
        title={fashion-mnist的gan玩具},
        author={苏剑林},
        year={2017},
        month={Aug},
        url={\url{https://spaces.ac.cn/archives/4540}},
}