数据折叠与人工喂养人工智能-百检网

首页
中国
数据折叠与人工喂养人工智能

人工智能的发展如火如荼。其背后必不可少的要素之一，供机器学习的大数据采集工作，如今依然出自人工之手。在因大数据而在中国西部异军突起的贵州省的深山之中，就有一群大数据采集者，他们是“人工智能背后的人工”。

由贵阳市区沿着刚修好的公路驾车50多公里，就到了百鸟河数字小镇。小镇上一个容纳400多人的数据工场，电脑前坐满了来自附近一家扶贫高职的学生。学生来自各个专业，来这里主要进行数据标注的实习。把人工智能需要识别的数据，通过分类、画框等方式标注出来。标注好的数据将用于“人脸识别、无人驾驶、语音识别”等高科技项目。譬如，把道路上的汽车、行人、红绿灯等框起来，用于自动驾驶的训练等等。

数据标注部接到新项目，采集不同场景下的三十二套动作，学生们按照图纸中的指定姿势拍下照片。数据标注是劳动密集型行业，门槛不高，经过几天培训就能上手。每天上班七八个小时，一个月挣两千元，是笔不错的收入。这些学生自己的家乡属于贫困帮扶地区，网络闭塞，4G网络信号还没延伸到这里，村里面没几户人家能上网，更别提人工智能和大数据了。

2018年3月26日，一家互联网公司在北京发布了**人工智能视频音箱。音箱的语音识别大数据，正是出自于像小纯这样的标注员。随着人工智能产业的飞速发展，需要的数据量也在持续增加，贵州那家数据工场的400多人，已经不能够满足甲方的要求。紧邻工场，又租下了一幢三层的楼，等待装修好继续扩招标注员工。

想起卓别林的《摩登时代》。100多年过去了，就这些学生而言，人机关系依旧。区别在于，在流水线上，卓别林做的是单调重复的体力劳动，人是机器；在“数字小镇”，学生们做的事同样单调重复，只不过是脑力劳动，人是“数字机器”。

学生小纯对未来前途感到迷茫，“即使数据标得再好，还是没有前途。”

“数字机器”只能偶尔显示生命的鲜活。

傍晚下班，小纯在路旁看见一簇花开了，赶紧拿起手机过去拍，“花开很美，可惜白天没有时间去看它*美的样子。”

这是人工智能产业链的一部分，“供给侧”。眼下，贫困山区中坐在电脑前框图的高职学生，这些年轻人也是“人机回圈”中的一部分。人机回圈的另一部分是“需求侧”，是一线大城市的自动驾驶研发和语音识别、图像识别等其他人工智能。

小纯和同学们正在源源不断地为北上广深的人工智能公司提供数据。他们想象不到，在人工智能“需求侧”一侧的模样。学生对被自己框住的汽车一概不了解，时常会好奇，标注里的SUV长什么样，无人驾驶是不是真的安全，还要不要考驾照等等。

在人机回圈的两部分人，供给侧和需求侧之间存在着被忽视的“数据折叠”。

在数字小镇，小纯、小广和同事们正在“以人工喂养人工智能”。卓别林“喂养”的是没有生命不会长大的机器。人工智能不一样，在“喂养”中一步步长大，*终可以轻而易举地把需求侧扩展到数字小镇。阿法元干脆把人机回圈中的这部分人淘汰出局。

在热潮背后，小广和他的同学也在担心着，他们教会了机器人学习工作，而未来的机器人会不会取代他们。http://slide.news.sina.com.cn/z/slide_1_64237_257098.html#p=4

看来，他们的担心多半多余。在中国，只要存在这样廉价的数字工人，人工智能产业链的需求侧就不会主动延伸和覆盖到这样的供给侧。在以大数据著称的贵州省，脱困脱贫有待时日。成为人工智能产业链供给侧的一个环节来喂养人工智能，或将是一段时期的客观事实。

因而，数据，依然不得不折叠。

上一篇《英语四级难不难过?.》
下一篇《词汇的遗传与变异？respect, respective和respectively》