请选择 进入手机版 | 继续访问电脑版
开启辅助访问
链路首页链路财经目前收录 币种 : 4908 交易所 : 310钱包 : 17 24H 交易量 : $43,403,137,051 总市值 : $245,388,183,835
2019
08/16
06:36
分享
评论

  • 深度学习的最核心理念是通过增加神经网络的层数来提升效率,将复杂的输入数据逐层抽象和简化。也就是说,将复杂的问题分段解决,每一层神经网络就解决每一层的问题,这一层的结果交给下一层去进行进一步处理。

    基于深度学习的人工智能和过去的人工智能原理不同,但与我们所了解的数据挖掘有相似的逻辑:先得到结果,反向寻找模式。这个过程被称作训练。

    目前先进的监控系统背后都有强大的人工智能支持,在经过大数据训练之后,可以瞬间从视频里识别出人脸、车牌、车型等,并且加以语义化,方便人类检索。然后只要给计算机几张嫌疑人的照片,神经网络就可以飞快地从海量视频中把与嫌疑人有关的镜头都找出来供人类参考。安防企业宇视科技就开发了这样的智能摄像系统,再结合百度地图,就可以迅速定位嫌疑人或者车辆的运动轨迹。

    从人类历史之初,知识就以语言的形式进行记录和传承,用来书写语言的工具不断改进:从甲骨到纸张,再到今天的互联网。所以不管是百度还是谷歌,都认为自然语言处理对整个人工智能的未来都是非常大的挑战。相比之下,语音识别,如声音到文字,或是文字到声音,实际上解决的是一个信号转换问题,但语言不是,语言和人的知识、思维整体相关。

    在百度,基于大数据、机器学习和语言学方面的积累,研发出了知识图谱,构建了问答、机器翻译和对话系统,建立了可以分析、理解问题(query)及情感的能力。仅就知识图谱来说,基于不同的应用需求可分为三类:实体图谱(entitygraph)、关注点图谱(attentiongraph)和意图图谱(intentgraph)。在实体图谱里,每一个节点都是一个实体,每个实体都有若干个属性,节点之间的连接是实体之间的关系。目前百度的实体图谱已经包含了数亿实体、数百亿属性和千亿关系,这些都是从大量结构化和非结构化数据中挖掘出来的。

    搜索所需要的技术基础也正是人工智能所需要的技术基础。比如就云计算来说,主管百度云工作的张亚勤认为,搜索是最大的云计算应用,没有云就没有办法做好搜索,百度是在云里出生的。

    就以“信息主动找人”来说,做Feed(信息流)是当下很多互联网企业的共识。但是“人找信息”和“信息找人”,或者搜索和Feed之间并不是非此即彼,而是相辅相成的关系,在不同场景、不同时段发生不同作用,各司其职,也会互相配合。

    百度人工智能业务最基础的是“物料层”,有基于GPU/FPGA的云计算平台、深度学习代码平台和大数据储备。这一层提供了进化的环境和工具。最上层SaaS是人工智能的各种应用。介于两者之间的是“人工智能基础技术层”。大脑所具备的“听说”(语音识别与语音合成)、“看”(视觉识别)、“读写”(自然语言处理)等认知功能就在这一层,大脑具备的决策规划、运动控制、预测推荐等决策功能也在这一层。广义的百度大脑即包含了以上三层。

    目前,百度宣布将向社会免费开源人工智能深度学习平台PaddlePaddle,开放百度大脑开放平台ai.baidu.com。前者为开发者提供算法编程环境,后者为应用开发者、数据工程师、数据科学家提供现成的百度人工智能成果接口。

    百度基于神经网络翻译模型技术的机器翻译系统正在快速学习各类语言。经过6年的积累,如今的百度翻译已经可以支持全球28种热门语言互译,覆盖756个翻译方向。百度语音可以支持粤语、沪语等方言的识别。

    “视觉”承担着我们80%的信息摄入工作。在解决“听”“说”问题的同时,我们也要教会计算机“看”,即图像识别。百度正在从四个方面推进计算机视觉计划。首先是人脸识别,通过捕捉人脸关键点形成人脸表情网,实现人脸的准确识别;其次是在类似百度地图的产品中,实现地图服务与图像智能识别技术的结合,打造数据无限逼近现实世界的效果;此外,百度无人驾驶技术也正在利用计算机视觉进行程序优化,从而使无人车的研发速度加快;图像识别还会被应用于AR(增强现实)领域提高视觉效果。

    正如互联网海量数据催生了Hadoop(由Apache基金会所开发的分布式系统基础架构)、Spark(加州大学伯克利分校的AMP实验室所开源的类Hadoop Map Reduce的通用并行框架)等流数据处理技术一样,人工智能已经在中国各地分散发展,犹如一个个神经节点,以其脑波促进中国大脑的到来,这是时代的召唤。

    如果说网民的需求是“天时”,企业与政府的合作是“人和”,数据则是中国大脑发展必不可少的“地利”。在这一领域,中国更是得天独厚。

    过去三十多年里,中国几乎抓住了所有“崛起”的机遇。在第三次工业革命时期,中国初步完成工业化,补上欠了100多年的功课。20世纪80年代,西方国家纷纷去工业化,中国承接产业转移,成为世界工厂。20世纪90年代末互联网起飞,中国终于和美国站在同一起跑线上。如今移动互联网的发展中国甚至稍胜半筹。中国重新崛起的辉煌一部分要归功于全球化。

    美国制造业提出的主要创新亮点在于3D打印。虽然一度以黑科技的面目出现,但3D打印的关键不在于技术,而是反映了制造业从大规模标准化生产转向大规模定制生产的趋势,最终反映了客户需求个性化、自组织化的趋势。

    云计算是新的平等起跑线。云做的事情是把复杂性移走,让做云的公司帮企业做IT,不是像传统的ICP(互联网内容提供商)服务公司,派几百个人到你公司去做,而是提供虚拟化服务。例如,过去是在家里建电站、打水井。现在是提供电网、水网,企业只要打开水龙头就可以得到水。企业不再需要部署那么多服务器,不再需要那么重的ERP系统,只需要接入网络,就可以连接所有的服务——计算、存储、数据库。于是商业端服务也消费者化了,方便快捷。

    今天,人类的多样性需求、反馈越来越被数据化,可以无限地产生并被传感器记录。也只有建立在概率和分布式计算方法上的深度学习与智能经济系统,才能从这无限的数据中感知未来的方向。

    知识化、自动化、精细化的生产方式的基础在于物联网。孙正义指出:“物联网与人工智能的关系,正如同眼睛与大脑配合使生物得到进化的关系。物联网爆发即将来临。” 物联网让人与万物接入同一张网络,让人与机器随时互动,人的一切可以数据化的行为、反应,都会引起机器和生产线的波动,各种数据在云端交汇,大量计算通过云服务器完成,再通过产品与服务反馈于人,循环上升,从而把人的多样性与物质世界联系在一起,彼此催生,共同进化。

    人脑将直接与云端进行连接,从而成为物联网的一部分。这将促进对大脑思维方式的逆向工程解析,不仅能够加深对人脑的理解,还可以反向提高机器智能,更加深刻地体会人的多样性细节。以往工业自动化仰赖的工业机器人,在物联网时代也将发生形态变革。工业机器人将从物理形态的硬件化向软件化发展,云端虚拟状态与物理端实体结合。机器人软件化和物联网是同一件事情在两个方向上的发展。机器智能无形化,遁入物体,与云计算结合,无所不在,成为一个巨大的社会机器人。这正是人工智能与物联网追求的境界。

    物联网自主收集数据只是基础任务,更高的境界是自主决策。人类提供了算法和训练模型,给机器装上传感器,让机器在各自的场景下做出判断和交流,并做出决策。决策会影响世界,从而又收集到新的数据,如此形成循环。

    无人车本身就是人工智能技术的集大成者,视觉识别、语音识别、自主决策、机械控制等集于一身,是一台运动的数据收集和处理器。在这个基础上,无人车网络把人、车、环境联系在一起,把个人目的和整体管理联系在一起。一旦无人车成规模运行,又会反过来带动技术发展和物联网的发展。无人车上的每一个部件传感器和乘客感应器都联系着生产商、消费者、管理者甚至第三方。设想一下未来,以无人车为主体的陆上交通会与航空、航海交通打通信息,那将是怎样一张上天入地的巨大的物联网。

    无人车也叫自动驾驶汽车,是指在没有人工参与的情况下,能够感知环境并进行导航的汽车。1925年第一辆无人车在美国上路时,发明者对它是否需要“智能”还未达成共识。但从此以后,无人车的形象出现在不同种类的科幻小说和电影里。

    在吸引人们踏上征程的未来世界,无人车不再只是通行工具,而是家和办公室之外的第三空间,移动、安全且舒适。人类以最低的成本穿梭在空间之中,以往由低效带来的堵车、污染、停车问题都将大为缓解,酒驾、闯红灯、超速等危及他人人身安全的驾驶行为将不复存在。无人车体系更有望成为全球物联网体系的血脉,甚至汽车作为一种交通工具的社会地位和符号意义也将发生彻底改变。

    20世纪90年代初,中国也研制出了第一辆真正意义上的无人驾驶汽车。在“863计划”支持下,很多大学与机构开始研究无人车。历经“八五计划”“九五计划”“十五计划”,北京理工大学、国防科技大学等五家单位研发的ATB(Autonomous Test Bed)系列三代无人车依次问世,ATB-2直线行驶速度最高可达到21米/秒,ATB-3在环境认知和轨迹跟踪能力上得到进一步加强。

    2013年,智能驾驶方兴未艾,美国高速公路安全局(NHTSA)就为智能汽车正式划分了等级。根据给出的定义,智能汽车的发展可以分为4个阶段:第一阶段(L1)是“高级辅助驾驶系统”,特点是为司机提供碰撞警示,紧急情况制动,盲区监测和弥补夜间行车的视力弱势。第二阶段(L2)被翻译为“特定环境的自动驾驶”,接近于通用公司的设想,车辆能在高速公路或是堵车这种相对规律的环境中自动驾驶。从第三阶段(L3)开始,我们对无人驾驶的期待有了一些轮廓,L3即为“多种环境中的自动驾驶”,车辆能适应所有路况,但在特殊情况下需要转交给人类驾驶员。到了第四阶段(L4),即“全自动驾驶”阶段,智能汽车真正做到了自主驾车。至于L3和L4的区别,从外形上看,L4智能车将在L3的基础上,撤掉方向盘和刹车。

    分类可以说是对汽车行业的一次重新洗牌。在无人车的江湖里,传统车企、互联网企业、出租车行业巨头三分天下。传统汽车生产商的兴趣点在于L1和L2,L3和L4则聚集了包括谷歌、百度、优步、特斯拉在内的巨头。今天,起着决定性因素的不再是资本和历史,而是各家企业的内在基因。L2和L3之间,有着老牌车企难以跨越的技术鸿沟。

    L4准入门槛极高,人工智能和高精地图信息不可或缺。因此,谷歌和百度占据了绝对优势。百度想做的也是“完全无人驾驶”,在技术路线上选择了几乎最难走的路:高精地图加传感器。与上述所有涉及L3的自动驾驶车高了几个数量级的难度。

    从百度地图十多年的运营,到百度大脑感知和决策能力的全面开花,再到对激光雷达供应商Velodyne公司的投资,与其说是百度选择了无人车,不如说是百度的专业逻辑将自己推到了必须承担起责任的这一步。

    Road Hackers的推出表明,百度在L3和L4双路径并行突进。对百度来说,L3的数据也可以用到L4,当收集了足够多的公路数据、场景数据、用户数据、车的数据,并将这些数据和激光雷达的数据结合起来,可以让L4更快地实现。

    中国电信在全球5G标准竞争中取得的成果令人兴奋。无人车是物联网中极具意义的应用,可以共享设定区域内的位置信息、外部环境信息、自身驾驶信息等,每辆车都会成为信息的接收者和发出者,实现整个区域内的协同驾驶,进而实现车与车、车与人、车与万物的相连。而无人车和物联网的实现正依赖于5G时代的到来。

    目前,无人驾驶技术在欧盟以及美国一些州都存在法律障碍。欧盟交通法律规定,汽车必须由持有相应驾照的司机驾驶,任何人不得以任何理由接管驾驶权。美国只有四个州支持自动驾驶汽车上路。

    人工智能可能正是处理海量信息、应对不确定性的最好工具。其创新突破以及在金融领域的实践,正开始让金融这种似乎总是高高在上的存在,重新俯身垂滴普罗大众,并为普惠金融的实现带来了曙光。

    那时我还没有想到,有一天,随着人工智能技术的发展,机器系统对金融业务的改变会达到今天这样的深度,渗透到金融信息处理、数据分析、风险控制、征信、智能投顾(Robo-Advisers)、智能获客、量化投资等各个方面。

    无论是在征信和反欺诈领域,综合用户画像构建风控模型;还是在投资领域,挖掘投资决策因子辅助投资决策;或是在投资顾问领域,为客户匹配个性化的投资组合等,机器对各种金融业务的渗透,本质上都是通过机器学习带来的金融信息处理能力的不断提升。

    一般来说,大数据风控的成果跟传统金融机构一样也是两个名单:基于白名单的征信,基于黑名单的反欺诈。后者因为“反黑”的目的,常常笼罩了神秘的色彩。

    智能投顾,也被称为机器人投顾、智能理财等,是指在人工智能和大数据的基础上,针对不同风险偏好和投资要求的用户,由计算机提供基于算法的投资管理建议,帮助投资者组建个性化的资产投资组合,实现个人资产配置的最优化。

    实际上,目前用于投资的人工智能算法都大同小异,以前是逻辑回归、因果分析;后来有了深度神经网络,有了所谓的梯度决策树;再后来有了遗传算法。但这些算法的进步,都没有超出相关性分析的范畴,只可以实现一些短期记忆的东西,毕竟还没有达到人类大脑的反应程度,对于投资市场上一些可重复、可循环的投资决策,机器可以很好地去安排。但是,对于有一定缺陷的市场,或者说在投资艺术层面上有缺陷的市场,还需要人工干预。

    智能革命一定是发端于领先学科和领先企业的,短期内会拉大企业之间的差距。但人工智能方法是公开的,便于学习,如果企业努力,就可以习得。在这个过程中,我们认为传统企业尤其需要人工智能领域的专业人士来引导。

    优秀的CTO绝不只是网管运维,还要发掘公司所有部门、产品与网络的价值链,跟踪最新的技术发展方向。他要了解产品和业务,预判长期技术战略方向,不断跟进业务和技术发展做革新,否则就会像历史上的电力官一样,等到电力普及了,就被工程师或者产品经理代替,不过至今在大部分工业企业中依然有电力官残余的影子,那就是电工。

    企业永远需要引领技术的角色。如今一般企业都会有CTO或者CIO(首席信息官),为了应对智能革命,吴恩达在2016年11月撰文提出,每一个企业都需要一位CAO(Chief AI Officer,首席人工智能官)。

    很多企业的Web1.0信息化和数据化工作都还没有做好,所以有人提出企业需要CDO(首席数据官)或者CIO。CIO是CTO的升级,来帮助公司组织信息。他们思考如何提升公司信息的传递效率,如何能共享信息而不是各部门重复生成同类信息等。有调查显示,CIO里非技术专业出身的比例也不小,因为CIO不仅要懂技术还要懂业务。

    CDO需要有洞察数据含义的能力,比如通过数据可视化技术直观地把握数据反馈;通过“数据挖掘”发现隐蔽的价值所在;通过优化企业数据架构,把无意识状态的数据变成主动的数据燃料。

    数据在CTO眼中可能只是技术副产品,但是在CAO眼中则是战略性资源。他需要花费大量精力来思考客户需求和完整的用户链条,以寻找方法来增强公司的产品和服务,并尝试在所有产品上与客户展开互动。CAO将与公司的不同部门(人力资源、销售、市场营销、产品等)进行合作创新,通过数据连接、整合不同部门。在深入数据整合、互动、挖掘时,会越来越需要成熟的方法和工具,此时,接入人工智能流也就呼之欲出了。

    引入成熟的机器学习方法,把数据变成训练材料,塑造自动化机制,寻找、发掘有价值的管理模式和客户模式,或者合理引入第三方人工智能流,支撑企业业务发展,并找到一个合适的创新循环:数据—算法—知识—用户体验—新的数据,循环往复,滚雪球式前进,在这个过程中创造商业价值。这就是CAO做的事情。

    电算化→信息化→智能化,神形合一,如果内部机制不顺,就会发现外部智能化缺少基础,难以为继。企业的内部修炼和外部拓展在智能时代将高度统一。

    这个例子再次体现出CAO所需要的思维模式究竟是什么——正是我们一再强调的相关性思维。牛奶和面包、啤酒和纸尿裤之间的联系,显然并非是以往科学领域的确定性关系或因果关系,而是一种以概率形式展示的强相关关系。想到从这个角度去发掘价值,这就是CAO具有的素养。

    CAO应该成为一个布道者和指引者,让整个企业具备一种人工智能的兴趣和品格。CAO将是新时代的企业偶像,就像产品大师是互联网时代的英雄(乔布斯)。人工智能知识、产品与管理思维以及合适的人文感受力将共同造就这种英雄。

    大数据世界的马尔萨斯定律可以这样来描述:人口以算数级数增长,数据以几何级数增长。数据量以线性规律增加,计算量以非线性规律增长。

    2014年,网站安全和内容分发公司Incapsula发布了一项统计数据:56%的网页浏览量都由爬虫机器人贡献。换句话说主要的互联网用户已经不是人类。大部分点击数据都是机器程序产生的。非人类访问中,近一半来自善意机器人,如搜索引擎的内容爬虫,它们能够对网页建立索引,方便人们快速查找到对应的网页内容。百度和谷歌等就使用这种方法整理全世界的信息。另外超过一半的浏览量就来自恶意机器人了,比如盗取内容的爬虫、各种黑客工具、垃圾邮件等,而且比例还在不断增加,某种意义上,这就是互联网阴暗面的真实写照。

    要跨越数据世纪的“马尔萨斯陷阱”,我们需要做三件事情:一是对并发的大量数据做出即时高效处理;二是高效存储数据并删除不需要的数据;三是对积存的数据资料进行深入挖掘。

    2015年百度云计算(阳泉)中心(以下简称阳泉云计算中心)在这里投入使用。建成后的数据中心存储量超过4000PB,可存储的信息量相当于20多万个中国国家图书馆的藏书总量;数据中心CPU总数高达70万个,CPU内核总数超过300万个;由于使用了高性能、低功耗服务器和多项适用中国环境及法规的科技来提升数据中心的整体能源效率,其PUE小于1.3。相当于每1.3度电进入机房,其中有1度电用于数据计算,0.3度电用于数据中心的散热等其他用途,在绿色节能方面达到亚洲一流水准。

    摩尔定律行将式微。目前计算机内存运行方面的提速仅为每年9%,硬盘性能的提速平均每年只有6%,计算机内存的运行速度只有CPU速度的几百分之一,成为瓶颈。数据存储吞吐的模式严重拖累了计算机性能。

    一个方向是物理学的突破应用,比如令人神往的量子计算,利用量子物理学中的量子态叠加效应,创造性能百万倍于现在的计算机芯片。用光流代替电流传递数据和运算,也是提速的一个方向。另一个方向就是伴随脑科学和深度学习的兴起,有希望模仿人脑原理开发神经学芯片,其运行速度也将比现有的计算机快多个数量级。

    FGPA相当于用硬件来做软件的算法,在实现复杂算法方面有一定难度。目前是配合GPU、CPU架构一起工作。

    机器的进化迭代过程比大自然快亿万倍。在这种对抗生成中,机器习得的逻辑已经远远超出人类的理解,可能成为一种“黑箱”。是追求“黑箱”,还是追求“白箱”,如何避免“黑箱”带来的不可知危险,这是对人类的一个挑战。

    目前多数神经网络的训练依赖有标签的数据,即监督学习。而给数据标注标签是一项繁重的工作。对偶学习最关键的一点在于,给定一个原始任务模型,其对偶任务的模型可以给其提供反馈;同样的,给定一个对偶任务的模型,其原始任务的模型也可以给该对偶任务的模型提供反馈。从而这两个互为对偶的任务可以相互提供反馈,相互学习、相互提高。

    除了Caffe和Mxnet等深度学习开源平台外,百度在2016年9月开放了全新的PaddlePaddle深度学习开源平台,采用新架构,对序列输入、稀疏输入和大规模数据的模型训练有着良好的支持,同时支持GPU运算,支持数据并行和模型并行,仅需少量代码就能训练深度学习模型,大大降低了用户使用深度学习技术的成本。

    “小鱼在家”可以支持手机、电视、音箱、汽车、机器人等多种硬件设备,同时支持第三方开发者的接入。DuerOS拥有百度语音识别与自然语言处理技术,还可以通过云端大脑不断学习进化。用户只要喊“小鱼小鱼”,就能唤醒它,然后就可以指挥它播放音乐、播报新闻、搜索图片、查找信息、设闹钟、叫外卖、闲聊天等;还可以唤醒多方视频通话、语音留言。

    美国的教训值得全世界深思。数字技术在美国发展久远,人工智能技术是这一技术的最新延伸。数字与智能技术本身不是导致失衡的罪魁祸首,与不公正的社会制度和不科学的经济政策结合却会加速失衡。而普通民众则是失衡后果的主要承担者。美国2016年大选结果体现的东西部州与中部州及东北铁锈带的鲜明对立,描绘的不只是政治对立,某种程度上,描绘的正是数字鸿沟。

    帕里西认为,目前的机器人或者人工智能与人的区别在于,人的思维中包含了动机与认知两种模式。人的任何行为都有动机,比如为了吃喝与生存、为了安全与繁殖、为了荣誉与理想等。而现有的机器人只有认知,无所谓动机,因为它的目的是由人设定的。机器人只是工具,为了满足人的特定需要而存在。

    在2017年1月5~8日举行的“Benificial AI 2017”会议上,1980名来自产业、学术和研究界的人工智能相关人士共同制定了“二十三条原则”,宗旨在于确保人工智能的健康发展,人人都能从人工智能中受益。这二十三条原则分为研究问题、伦理价值观和长期问题三个部分。

主题帖 239 关注 0 粉丝 0
情感指数

链路大数据分析置信度 52.56 %

TA的主题帖
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表