11月8日,猎(liè)豹移动董事长兼 CEO 傅(fù)盛出席第五届世(shì)界互(hù)联(lián)网大会“物(wù)联网:连(lián)接无处不在(zài)”论坛,并发表题为《真开放·全链条AI技术赋(fù)能物联(lián)网》的主题演讲。
猎豹移动董事长兼CEO傅(fù)盛
傅盛表示,即便是在今天的生产线上,也很(hěn)难解决(jué)设(shè)备智能化(huà)的问题(tí),而(ér)AI让机器(qì)第一次拥有了人类的感知能力,也让物联网终端更聪明(míng)。这是一(yī)个巨大的分水(shuǐ)岭,使得AIoT的(de)概念开始(shǐ)出现。在行(háng)业和自身的变革背(bèi)景下,猎豹移动携旗下人工智(zhì)能公司猎户星空,研发了(le)包括语音识别、视觉识别、室内导航(háng)平台等在内的行业(yè)唯一(yī)全链条AI技术。
他说到,“我们未(wèi)来不会单做(zuò)一款硬件,我们(men)致力(lì)于打造AI赋能的云端操作系统,跟开(kāi)发者(zhě)一起做更多的物联(lián)网设备。”
以下是演讲全(quán)文:
首(shǒu)先,我花(huā)一点时间介绍一下猎豹(bào)移动。猎豹移动(dòng)是一家经历过三(sān)次跨(kuà)越的公(gōng)司,2010年由我自己创办的(de)可牛(niú)影像和金山安全合(hé)并而成。
当时我们经(jīng)历的第一(yī)波是PC杀毒软件(jiàn)免费化,实现(xiàn)了第一次的增长。
第二波在移动互联网(wǎng)的时候,我们碰(pèng)到了强大的对手,决定出海。我们是(shì)第(dì)一家大规模的把(bǎ)用户做(zuò)到海外的(de)中(zhōng)国公司。今天,猎(liè)豹移动大概有5亿(yì)多的(de)月度活跃用户,其中(zhōng)80%来自于海外,完全走出了一条不一样的(de)曲线,我们内(nèi)部叫做“天外飞仙”。所以我们现在依然是Google工具(jù)排行榜的第一,我们游(yóu)戏的(de)下(xià)载(zǎi)次数在全球接近(jìn)20亿次(cì)。
第三波是在2014年上(shàng)市以后。我当时就意识到(dào),整(zhěng)个移动互(hù)联网的风口将尽(jìn),我们需要寻找下一个机会。我们在硅谷、以色列都投资了(le)基金,由此看到了人工智能的机会。
AI让机器拥有感知能力 全(quán)力以赴打造全链条AI技术
我对人工智能(néng)有一些自(zì)己的理解和(hé)思(sī)考,我(wǒ)们讲了(le)很久(jiǔ)的物联网、智能硬件(jiàn),其实在AI或者人工智能出现之前,所有的智能硬件都是伪智能硬件。那个时候(hòu)的智能硬件本质(zhì)上是(shì)联网(wǎng)硬(yìng)件(jiàn),你要掏出手机进行操作。大概在三五(wǔ)年前,各种智能硬(yìng)件的行业都起来了,但是很快这个行业又衰落了。
我甚(shèn)至想要把(bǎ)机器(qì)人行业划(huá)分成(chéng)两个分水岭(lǐng)。在(zài)AI出现之前的机器人本质上都是自(zì)动化机(jī)器,没有人的属性。我(wǒ)们看产(chǎn)线上(shàng)那么多漂亮(liàng)的(de)机械(xiè)手,其(qí)实都是通过(guò)非常原始的编程和(hé)自(zì)动化的(de)设备进行生产的。即便今天在生产线上,也很难解决智能化的问题。
但(dàn)AI出现以后,第一次让机器有了人类的感知能(néng)力(lì),我们以前的摄像头看(kàn)到的都是0101等一串数字(zì),但今天摄像头看(kàn)到的是人脸;以前看到的语(yǔ)音是(shì)波形,我们现在看(kàn)到的语音是文字。
机器开始有(yǒu)了(le)人类的感知能力,使(shǐ)得AIoT的概念开始出现(xiàn),看(kàn)到(dào)这个机会以后,我们就去做(zuò)了行业唯一(yī)的全链条AI技术。包括语音识别、视(shì)觉(jiào)识别、导航、机(jī)械臂(bì)、麦克风阵列等,为什么要做(zuò)呢?
这(zhè)是从内外两个方面思(sī)考的(de)。
第一个,猎(liè)豹(bào)移动(dòng)在(zài)以前做的太快了。我们就(jiù)做一个小工具,居然(rán)就上市了。后(hòu)来(lái)等(děng)到Google发政策不让我(wǒ)们(men)做工具,手机厂商都开始自(zì)己做(zuò)工具的时(shí)候,我们(men)的日子就变(biàn)得很艰难。所以(yǐ)我(wǒ)当时就(jiù)想(xiǎng),拥有自己的(de)底层技(jì)术很关键。
第二个,因为(wéi)AI行业还(hái)处于早期。很(hěn)多技术都不完(wán)善,或者没有形成产业(yè)分(fèn)工(gōng)。但很多开发(fā)者,拿一块板(bǎn)子,拿一(yī)个所谓的(de)开放平台,就(jiù)想实现(xiàn)很好的语音识别效果,其实是非常难的。以智能音箱为例,换(huàn)一个外(wài)壳罩(zhào)上去,算法就得调整,因为混响(xiǎng)不一样。就像(xiàng),在你(nǐ)的耳朵上加一(yī)个耳塞,听力就可能大幅度下降,和你的大脑聪(cōng)不聪(cōng)明没(méi)关系。所以整个人工智能产业的链(liàn)条都(dōu)非常新,又没有(yǒu)足够的分(fèn)工。
第三个,我意识到,AI其实并不算是一个不(bú)可逾越(yuè)的黑(hēi)科技(jì)。很多人(rén)都说,BAT才能做AI,或者人家的积累更好一点(diǎn)。但(dàn)是今天看来,开源代码会远远(yuǎn)丰富于任何(hé)一个时(shí)代。很多大(dà)洋彼岸的论(lùn)文出现之后,中国的工(gōng)程师就很快把它实现了。所以(yǐ),好处就在(zài)于,AI大大降低了技术壁垒。而且AI使得(dé)以前很多公司的积累(lèi)变得无效,大(dà)家处在同一(yī)起跑线上。我们认为,这是(shì)一个弯道超车(chē)的好机会。
所以,我们(men)当时就下定决心,把所以(yǐ)技术(shù)全都干了一遍,全力以赴打造全链(liàn)条 AI 技术。全干一遍的好处(chù)就是,我们能够自主调整很多细节。
语音交互(hù)实(shí)现了命令的自然化 可能颠覆手机的中心地位
我认为(wéi)真正(zhèng)有智能的第一(yī)个硬件(jiàn)品类,应该是(shì)智(zhì)能音箱,我一直在想,语音识别是什么东西?今天(tiān)有人谈(tán)“语(yǔ)义理解能力超过人”。只要(yào)看到这(zhè)种标题,基本上都是骗子(zǐ)。
为(wéi)什(shí)么这么说?在语(yǔ)义的理解上,AI离(lí)人有巨大的差距。因为语言是人(rén)类超级牛的发明,你能够把你对世界的理(lǐ)解,压缩成(chéng)一串很短的文字输入给对方,对方听完(wán)以后,能(néng)把(bǎ)这个图像、事件还原(yuán)出来(lái),这是个相当牛的能力,人类(lèi)之间的交流是带有(yǒu)巨大的信(xìn)息压缩和背景知识的(de)。
所以,今天机器完(wán)全做不到。AI想在阅读理解上(shàng)超过(guò)人类,那是(shì)在一个很(hěn)有限(xiàn)的短(duǎn)文(wén)章(zhāng)里,没有实际(jì)意义。
真正(zhèng)的(de)语(yǔ)音操作(zuò)是什么?我认(rèn)为它的本质(zhì)是(shì)实现了命令的自然(rán)化(huà)。乔布斯有一句话(huà)说,每一次交互(hù)操作的演进都是一次革命(mìng)。苹(píng)果有幸抓(zhuā)住了两次(cì)革命,第(dì)一个是抓住(zhù)了键盘和鼠标,第二个(gè)是抓(zhuā)住了触(chù)摸屏。
今天(tiān)的手机不(bú)是因为它(tā)有多么智能,而是(shì)因为它有强(qiáng)大(dà)的处理能力,你可以非(fēi)常(cháng)方便(biàn)地touch。所(suǒ)以手机立(lì)刻(kè)取代了以前(qián)的PC、电视(shì),成(chéng)为了(le)你(nǐ)的中心位置。
但语音使得手机的中心位置有可能被颠(diān)覆掉,你(nǐ)想象一下(xià),语音是什(shí)么?比如,你想看《延禧攻略》,以往你需要(yào)从口袋里掏一个(gè)东(dōng)西,解锁、搜索,未来可(kě)以用语音就直接唤醒:我想看《延禧攻(gōng)略》。
我甚至认为,虽(suī)然(rán)手机还是个非常关键(jiàn)性的设备,但下一代设备都可以(yǐ)变得(dé)去手机化。
两(liǎng)年前,我们是业内第二(èr)款做(zuò)智能音(yīn)箱的厂商。我们(联合喜马拉雅(yǎ))做(zuò)了一款小雅(yǎ)音箱,当时很(hěn)多(duō)人就问我,智能音箱有多智能呢?我回答:你不(bú)要(yào)考虑它有多智能,你只要考虑它是个摇控器(qì),能够非常简(jiǎn)单(dān)地点歌(gē)、了解天气,设(shè)置闹(nào)钟。我们买来了对(duì)手(shǒu)的产品,我们(men)发现点歌根本点不准,只有50%的准确率。为什(shí)么?不是语音识别的(de)问题,而是(shì)内容上(shàng)的问题(tí)。比如说(shuō)今天抖音出了个神曲(qǔ)叫《我们(men)一起学猫叫》,你的(de)曲库里得有这(zhè)首(shǒu)歌。有的时(shí)候用户(hù)说叫“学猫叫”,有的说喵喵喵,有多种(zhǒng)的说法。这不是(shì)一个智能的活儿,这是个产品的(de)活(huó)儿。
所以我们就把音乐的(de)点播率和内(nèi)容的点播率,这一(yī)件事儿做好了。当时,我(wǒ)觉得智能音箱的核心不是它(tā)有多智能,而是一种新(xīn)的交互模式。这种(zhǒng)新的(de)交互模式本质(zhì)上就是一个摇控器(qì),它把极其复杂难用的(de)摇控器(qì)给改掉了(le),这(zhè)个进步是非常(cháng)巨大的。
iphoness刚出来的时候(hòu),大家说(shuō)这个没有全键盘、没有硬键盘(pán)怎(zěn)么用,输入(rù)内容太慢(màn)了。但就是因为它方(fāng)便,你可以容忍(rěn)它非常多不够快速的地(dì)方。
我(wǒ)们赋能(néng)了很多(duō)物联网的(de)中枢,我(wǒ)坚定的认为,语(yǔ)音是下一代操作系(xì)统的界面,它一定可(kě)以使得物联网的很多设备变得智能。可(kě)以跟(gēn)你直接交互,不需要通过手(shǒu)机APP的方(fāng)式,它自己就被赋能了。我们跟很多厂商合作了很多款音箱,因为我们觉得打音箱(xiāng)上的战役可能打不过,但(dàn)是(shì)合作是有机会(huì)的。
人工智能不(bú)会颠覆人 只要一点突破就(jiù)会带来变革
我们还做了一款能移动的售卖(mài)机(jī)——零售机器人(rén)豹小贩,它会(huì)主动问你(nǐ)是否(fǒu)需要商(shāng)品,用户扫描(miáo)二维码(mǎ)就(jiù)可以购买。看到人多的(de)地方它就会过去,因为它有人脸识(shí)别(bié)技术。以前(qián),售卖机只能放在一个地方,如今,自动售卖(mài)机的售卖效率,大概是传(chuán)统的三到五倍(bèi),用互联网的定律看,当多一(yī)个链接,互联网就损(sǔn)失(shī)了50%以上的流量。而在(zài)线下零(líng)售端,当你从原有的位置(zhì)走出来,让用户看到有一点点改进,效率的改变是巨大的。
在机械臂(bì)方面(miàn),我专门(mén)去发那科看过他们的生产线(xiàn)。我个人(rén)觉得(dé),在精密制造上和日本、德国企(qǐ)业去比拼(pīn),是(shì)没(méi)有机会的。因为他们是三十年的积累(lèi),可(kě)以用机械臂生产机械(xiè)臂。但(dàn)是他们面临一个问题:整个产线投产(chǎn)周(zhōu)期非常长(zhǎng),他要改变(biàn)一个产(chǎn)品的时候,整条产线都要变,成本非常高。
我一直在(zài)想,AI 出现之(zhī)后,可能不需要精密的机械臂,来做生产。我想到我奶奶的手,哆哆(duō)嗦嗦的,但她仍然(rán)能够织毛(máo)衣(yī),还可以穿针引线。核心不(bú)是因(yīn)为她的肌肉能够多么精确地控制,而(ér)是因为她能用(yòng)眼睛做最后一点点(diǎn)调整。
受(shòu)此启发,我们在机械臂上加上了摄像头,使(shǐ)得它去抓杯子的时候,杯子怎么样放都(dōu)可(kě)以抓得(dé)到(dào),这样(yàng)可以降低对机械(xiè)臂精度的(de)要(yào)求。
做机械(xiè)臂的(de)机床,如果从(cóng)日本(běn)买,大概需要 2000 万的投资,六个(gè)月之后(hòu)拿货,我们现在正(zhèng)在(zài)尝试用韩国产的机(jī)床为我们(men)做谐波减速器,未(wèi)来可能用国产的(de)机(jī)床。虽然精(jīng)度降低(dī)了(le)一点(diǎn)点,由于(yú)由于有视觉技术,所以它(tā)最后肯定能完成动作。
因为机械臂(bì)最大(dà)的(de)成本就来(lái)自于谐波减速器,我们正在做(zuò)的机械臂(bì),未来可以降到市(shì)场价格的三(sān)分(fèn)之一。当机械(xiè)臂的价(jià)格降低,可能会产生新的、比工业市场(chǎng)大十倍的(de)市场(chǎng),市场增大十倍之后,成本又(yòu)会进(jìn)一步降低。在 AI 赋(fù)能之后,机(jī)械(xiè)臂是有可(kě)能实现跨越(yuè)式增长的。
在接(jiē)待服(fú)务方面,如果大家有兴趣的话,可以去猎豹移动参(cān)观一下。我们的前台已(yǐ)经是机(jī)器人接待了,我们是一家没有前台(tái)的(de)公司,只有机器人。你来的时候,我在OA上(shàng)提(tí)一个申请,然(rán)后你会收到一条数字码(mǎ),机器人就会过来。你跟它说“我(wǒ)来面试”或者开会,把数(shù)字码输上,它给你拍张(zhāng)照,在我们的闸机上刷一下脸,你就可(kě)以进入公司,它也会带(dài)你去(qù)会议室(shì)。
今天讲人工智能(néng),很多人太(tài)强调所谓颠覆人(rén)的智(zhì)能,这条路我还没(méi)有看到(dào)颠覆人的(de)地方(fāng)。但核心是有(yǒu)可能(néng)实现(xiàn)一点点突破,比如说它能够把原(yuán)来的0101这种信号,对应成真正的人脸和语音(yīn)的(de)字(zì)节的时候,其(qí)实我(wǒ)觉得这个机会(huì)就已经非常非(fēi)常巨大了。它会让很多设备具备人的感知能力(lì),在(zài)一个非常垂(chuí)直的领域,完成(chéng)一点点工作。这一点点(diǎn)工作,可能会带来巨大的变革。
我们最近刚跟一个酒店签约,我们的音箱进(jìn)酒店了。以后(hòu)你(nǐ)到房间以后,你就直接可(kě)以说,开灯。你可以跟音箱说:“给我来支牙刷”,酒店系统就会收(shōu)到(dào),服务(wù)员很快就会把牙刷(shuā)送过来(lái)。这样的(de)话(huà),通过人工智(zhì)能技术可以让(ràng)物联网的设备变得更聪明(míng),而且真正可以使得照明、空调等设备变得互联(lián)互(hù)通(tōng),非常好(hǎo)用。
我希(xī)望机(jī)器人也好,音箱也好,都能跟(gēn)各行各业合作,我们的本(běn)质不(bú)是(shì)想做一个硬件,我们(men)的本质还是想(xiǎng)做一个(gè)AI赋(fù)能的云端(duān)操作系统,跟开发者(zhě)一起做更(gèng)多的物联网设备。谢谢大家!