趣味测试分类

首页 » 常识 » 常识 » WAIC2019黑客马拉松四十八小时鏖战
TUhjnbcbe - 2025/8/1 20:58:00
                            

原创:Synced机器之心

机器之心报道

作者:微胖

垃圾难分、智能制造火热、Pepper机器人做你的英语私教、AutoNLP全自动建模.......WAIC黑客马拉松四十八小时鏖战,亮点不断。

8月29日上午,WAIC黑客马拉松与世界人工智能大会开幕式同时启动,在张江人工智能岛火热开赛。作为世界人工智能大会期间唯一的一场黑客松,该大赛由机器之心承办,张江集团协办,阿里云、微软Azure提供云计算资源支持,张江创业工坊、微软人工智能和物联网实验室提供场地支持。

此次黑客松设计了四大赛题,主要聚焦AI技术与应用的热点问题,分别由微众银行、软银机器人、第四范式以及微软AIoT实验室进行命题,吸引了来自世界多个国家近百余支团队、数百名开发者报名参赛。

在决赛阶段,48支团队近位开发者线下展开了四十八小时的鏖战。最终,十三支队伍分列各赛题前三,取得胜利。

微众智能垃圾分类:识别率不理想,场景更难找

和其他三大赛道比起来,这个赛道的团队成员最为年轻。

尽管如此,这一命题还是比我们想象中更有现实意义。据在场评委介绍,在探索智能技术在垃圾分类的应用上,上海做的远比外界认为的多。目前,从前端的居民生活垃圾分类,到小区垃圾装运,再到垃圾厂分选处理,计算机视觉被应用到了每个环节。

作为出题方的微众银行也进行了相关实践。他们曾经花了两周左右的时间做了一款智能垃圾识别的小程序。

垃圾分类范围非常广泛,包括生活垃圾、建筑垃圾(比如居民装修产生的垃圾)、电子垃圾、医疗垃圾等。本次挑战赛聚焦生活垃圾,利用深度学习图像分类模型的构建,实现(上海)四大类别垃圾图片的精准识别,包括湿垃圾、干垃圾、有害垃圾和可回收垃圾。

为此,微众银行发布了00张图片作为训练集、张图片作为测试集(参赛者不可见),考验参赛选手模型的建构、抗干扰能力以及迁移能力。

一共有九支队伍参加了此赛题的角逐。最终,skype脱颖而出,拔得头筹。

skype答辩中

skype首先捋顺了识别逻辑。在她看来,模型构建的过程和人类认知过程差不多:通常,人类一眼就能识别自己扔的是什么垃圾,比如苹果、电池、筷子、纸盒。然后,再根据相关提示进一步分类到合适的垃圾桶,比如干垃圾或者有害垃圾。

微众银行提供的数据也涉及两级目标分类:一级目标的四大类和二级目标的多个种类,覆盖了主要的生活垃圾。

skype认为,可以将任务理解为一个二级标签空间上的分类以及标签映射问题。随后,她介绍了自己的分类器设计、特征提取模型以及推断策略。和其他选手不同的是,在整个比赛过程中,她并没有爬取额外的数据。

从最终结果来看,验证集结果明显好于测试集。其中,针对有害垃圾的识别效果较差;可回收和干垃圾识别效果最理想,可以达到80%以上。

分析其中原因,她认为有一点在于训练集与测试集差别很大。如果要提升效果,还要在数据搜集方面多下工夫,更加切合实际情况。

评委也针对她的算法设计提出了自己的看法:不要为了算法而算法,可以考虑将常识添加到分类设计中。

评委进一步解释道,上海将垃圾分为四大类别,其实并没有大多数人想的那么深奥,本质上也符合生活常识:原则上,人吃的东西,剩下来就是湿垃圾;可回收垃圾无非就是玻璃、塑料、金属、纸张和衣服;至于干垃圾,就是一个兜底的类别。

另一位评委赛后告诉机器之心,他们发现一些参赛选手在算法处理上有一些很有意思的地方,这位skype选手的处理方式比较特别,让她印象比较深刻。事实上,在点评过程中,评委也曾就推理策略与选手有过几轮交流。

第二名「分不清什么垃圾」算是本赛道最有故事的选手:垃圾分类本该是CV选手的天下,然而这位背景为NLP的同学却独自完成了比赛,且获得了第二名的好成绩。

作为一名NLP选手,他看到图片后的第一反应是如何用imagecaption将图像中的语义、物体转化为文本,然后再进行垃圾分类。NLP背景让他没有完全依赖外部形态,而是考虑到了语义特征。他最终选择了Resnet50进行训练。

「分不清什么垃圾」答辩中

第三名是「sharinghappiness」。第一次训练后,和其他获奖选手一样,他的图像分类结果在测试集上的效果出现了大幅下滑,仅有49%。他认为,除了模型,数据本身也有很大问题,比如爬取图和实际垃圾差距比较大。

接下来,选手对不合理数据进行了人工清理,同时为二级类别每个类型增加了张图片并加入到原始数据,然后进行了二次训练。结果,算法在测试集上的准确率提升了30%多,大概为79%。因为将主要工作都集中在了数据工作上,选手认为,最终结果的提升也与此关系重大。

需要说明的是,79%是四类垃圾分类效果的平均值。就具体类别来说,和其他选手遇到的情况一样,有害垃圾识别率最低,即便是从网络爬取一些图片后,效果仍不理想;而效果最好的是干垃圾。

评委对干垃圾识别率高的这一结果多少有些意外,在他看来,干垃圾作为一个兜底分类,包含垃圾成分会比较多,也比较复杂。理论上,识别起来应该更加困难。或许,这一结果与参赛者的样本有关。

sharinghappiness团队答辩

从应用场景上来看,大家几乎都设想到了手机、电脑等前端甚至后端工厂的应用可能性。

笔者非常赞同第三名获得者的一个观点:最终,特别是在后端,往往需要不同技术手段的联合,包括光学技术、机器人甚至其他物理方法。事实上,目前搭载了CV的机器人,也仅仅在后端工厂的最终质检环节发挥作用(甚至可以说可有可无)。没有被委以重任的一个很大阻碍,仍然是处理速度。

纵观整个比赛过程,我们可以看到一些共性,比如ResNet成为大多数团队的首选,都非常强调数据集对识别效果的重要性。

针对几乎都在有害垃圾识别上翻车的现象,评委告诉机器之心,选手普遍反映数据集存在一些挑战,比如数据量不够。但数据也与算法要服务的具体场景有关系,比如,如果知道这个算法所要服务的场景的具体情况,然后有的放矢地去收集相关数据,算法效果会有改善。

在评委看来,最棘手的问题其实不是算法,而是找到一个非常合适的落地场景。相对而言,在后端的CV识别可能更能满足比较刚性的需求。

传说中的智能分类垃圾桶

评委的一番话,让我想起位于张江人工智能岛大门一侧的那台巨型智能垃圾箱,据厂家介绍,这个垃圾箱价值好几千。

该垃圾箱配备感应器,当我将易拉罐靠近一扇关闭的小窗时,系统会感应到进而打开小窗。易拉罐扔进去后,小窗立刻关闭。不一会儿,就可以听见系统识别出这是可回收垃圾,轰隆一声,本来水平的铁板向可回收垃圾一侧倾斜,易拉罐掉了进去。

如果我扔进去的是一袋未加分类的垃圾呢?机器之心曾在WAIC现场询问过该垃圾箱制造厂商,对方说,系统会直接默认为不可回收垃圾。

虽说系统可以识别97%的可回收垃圾,可当你观摩过黑客松现场就会发现,这其实是最容易做好的一类识别:

可回收垃圾无非就是那几样,通常都是有形的,效果当然好;相反,如果是湿垃圾,因为早已不再是有形的(苹果变成了苹果皮),识别起来就更困难了。

据了解,目前这台智能垃圾系统还无法进一步区分玻璃瓶和易拉罐(仅能识别这是不是一个瓶子)。至于能否像国外网红智能垃圾桶Oscar那样识别出瓶子包装上的可口可乐等logo,厂家告诉我们,这也是他们努力的方向,但目前做到的识别率仅30%多。

评委告诉我们,识别更多的商品包装信息对数据集要求就更高,目前简单的一级、二级分类目标就无法满足需求,数据规模也要变得更庞大,这也意味着更加复杂的工作。笔者不由一惊,如此一来,智能垃圾桶的价格岂不是要上万了?!

微软智能车间:实力强劲,亮点不断

在微软智能车间挑战赛中,出题方主要聚焦两大问题:一方面

1
查看完整版本: WAIC2019黑客马拉松四十八小时鏖战