中国AI有三大短板,该如何以长补短?

2018-10-16来源: 爱数智慧 关键字:AI 爱数智慧 大数据

相关文章


      “加强新一代人工智能研发应用,在医疗、养老、教育、文化、体育等多领域推进"互联网+"。发展智能产业,拓展智能生活。”今年的政府工作报告强调。自两会开幕以来,从互联网大咖们的发言到总理报告,都有着“人工智能”的身影。中国目前正加快进入智能时代,人工智能行业正在飞速发展,同时,中国人工智能还有一些不足之处。     

      牛津大学未来学院的一份报告《解码中国AI梦》,考察了中国人工智能的战略和背景,综合硬件、数据、人才、算法和产业等核心驱动力,提出“国家AI潜力指数”,对比中美后发现中国当前AI实力约为美国的一半,除了数据,在其他方面均处于落后水平。


(图为中国和美国AI实力对比,中国仅为美国一半)


      如果数据因素比其他因素权重高出三倍,那么中国和美国的AI潜力相当。提高数据因素的权重,有一个行之有效的办法,就是提高数据的利用效率,这样还可以带动人工智能行业的发展。

      我们现在生活的方方面面都在产生数据,例如我们在电商平台的浏览记录和购买记录、在社交平台发布的照片和视频、在博客中写的博文,无一不是数据。但是这些数据不能作为训练数据直接用于模型训练。从网上爬取而来的数据,属于row data,或者叫做裸数据,是没有经过加工的,这样的数据直接用于模型训练,不能提高模型的识别效果,甚至还可能会起到负面的作用。裸数据必须经过清洗并按照应用要求进行标注之后,才能用于模型的训练,机器理解人和数据的目的,才能真正实现数据的高效利用。

      正如爱数智慧(Magic Data)创始人、中科院副研究员张晴晴女士所提到的「“Garbage in,garbage out.”给模型输入什么样的数据,就会得到什么样的性能。没有好的数据,就很难提高产品的性能。」无论是网上爬取的数据,还是采集到的数据,所有的数据必须经过有效的清洗和标注才能用于人工智能模型的训练。


上图为爱数智慧制作的街景道路物体分割图像及对照图片


      Magic Data致力于将日常生活中源源不断的数据进行汇总,用于不同的场景或者领域中,针对性地进行结构化地处理。以结果为导向对数据进行处理,根据以往的算法经验,对数据处理方法进行动态调整,使得得到的数据更加专业、更加精准。

      数据的利用率提高,带动人工智能垂直行业的发展,有效提高中国的人工智能实力。






上一篇:AI大咖杨立昆:机器如何像人一样聪明? 下一篇:爱数智慧喜提“2018胚芽企业” 携手共创AI产业未来
本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。

imagicdatatech.com Beijing MAGIC DATA Co., Ltd.