由声智科(kē)技研发的“AI数字人垃(lā)圾(jī)分类管(guǎn)家”融(róng)合了(le)人脸识别、智能语音交互(hù)、行为识(shí)别等技术,使垃圾(jī)分类管理(lǐ)更加方便快速(sù)。
一台可以书写的智(zhì)能交互机械臂,用毛笔写下(xià)“一起向未(wèi)来(lái)”;一部多(duō)足行走机(jī)器人和一(yī)部跳舞机(jī)器人,共同(tóng)跳起了一段舞蹈,随后,跳舞机器人还单独进行了一段武术表(biǎo)演,抱拳开臂,马步(bù)弓步(bù),一招(zhāo)一式憨态可(kě)掬。这是记者(zhě)在北京声(shēng)智(zhì)科技有限公(gōng)司(以下称(chēng)“声智科(kē)技”)展厅里看到的景(jǐng)象。
声智(zhì)科(kē)技成(chéng)立于2016年,专注于声学(xué)前沿技(jì)术和人工智(zhì)能领域(yù),主要面向数(shù)智健康、数智城市等场景提供产品和解决(jué)方案。凭借持(chí)续创(chuàng)新研发(fā),声(shēng)智科(kē)技获(huò)得了吴文(wén)俊人工(gōng)智能科(kē)学技术奖、北京市科技进步二等奖等多个奖项。
突破技术难(nán)点
“声智科技是(shì)从研发(fā)远场语音交(jiāo)互技(jì)术起步(bù)的,你刚才(cái)看到的那几(jǐ)个智能机器人搭载了声智科技研发的智能语音交互(hù)技术(shù)。”声(shēng)智科技创始人陈(chén)孝(xiào)良说,随着物联网技术的普及(jí),语音成为人机交(jiāo)互的新入(rù)口,支持远场语音交(jiāo)互的产品市场潜力很大(dà)。
“远场语音识别技(jì)术面临诸多研发难(nán)点,比如环(huán)境噪声、人声、房(fáng)间混(hún)响的(de)干(gàn)扰等。若采(cǎi)用常规语音处理方(fāng)法,会导致信(xìn)号失(shī)真和资源消耗大,使得语音识别(bié)技术准(zhǔn)确率低,应用困难。”陈孝良说。
凭借(jiè)深(shēn)厚(hòu)技术积累和(hé)持续研发,声智科(kē)技先(xiān)后攻(gōng)克了多项(xiàng)远场语音交互关键技术,包括回声抵消技(jì)术、噪声消(xiāo)除(chú)技术、声源定位技术(shù)、语音识别技术等。如今,这(zhè)些技术(shù)已应用于一(yī)些消费(fèi)级电子产品中,声(shēng)智科技也成(chéng)为国内不(bú)少知名企业的合作伙伴。
“我们意识到(dào),伴随着(zhe)人工智能的快速发展,人(rén)机交互(hù)、协同(tóng)过程中(zhōng)的多(duō)数问题,都不能靠单一技术解决,需要(yào)将语音、图像(xiàng)识别(bié)、大数据(jù)等技术(shù)结合(hé)起来(lái)。只有推进多模态、多技能的融合,才能(néng)实现更多场景(jǐng)的应用(yòng)。”声(shēng)智科技(jì)副总裁(cái)李良斌说。
他介绍,声智科技的做法是,用(yòng)“多模态”确(què)保机(jī)器具有“声、光、电、热、力、磁”多种感知技术;用“远场”解决机器在远距(jù)离场(chǎng)域中对多模态信号(hào)的分析;用“多(duō)技能”赋予(yǔ)智能(néng)系统多种能力,通(tōng)过(guò)多技(jì)能相(xiàng)互(hù)协同,完成复(fù)杂任务。
基于这种技术理(lǐ)念,声(shēng)智(zhì)科技研发推出核心技术产品——壹元人工智能开发(fā)框架。基于这个框架,声智(zhì)科技(jì)融(róng)合了(le)远场声光(guāng)、多模态识别(bié)等多(duō)项技术,围(wéi)绕智慧社区、智(zhì)慧交通、智慧办公、智(zhì)慧医院(yuàn)等应用场(chǎng)景,提供AI产品及解决方案。
截至目前,声智科技已经参与了(le)50余项国家行业标准的制定,拥有(yǒu)国内(nèi)专(zhuān)利2000余(yú)项。在(zài)2020年前(qián),声智科技(jì)总融资(zī)金额超过(guò)3亿元。陈孝良说,这些融(róng)资全部投入(rù)到核心技术的持续研发上。
助力智慧防疫
新冠(guàn)肺炎疫情暴发以来,声智(zhì)科(kē)技(jì)自主研发的技术产品,用于多地的防疫服务中。
记者(zhě)刚(gāng)走(zǒu)进中关(guān)村前沿技(jì)术(shù)创(chuàng)新中心的一楼大厅,就听到清(qīng)脆的声音(yīn):“您(nín)现在的体温是36.5摄氏度,没有(yǒu)发热症状”。声音来自一台(tái)测温机器人,在机器人(rén)显示屏上,除了实时显示被检测者(zhě)的红外热成像信息和(hé)温度值,还能查看(kàn)全国疫情数据,测温精度在(zài)正负0.2摄氏度。
声智科技首席知识官常乐介绍,这个测温机(jī)器人可(kě)在几(jǐ)秒钟内完成1米至6米范围(wéi)内多个目标的高精(jīng)度测温(wēn),支持实(shí)时AI语音合成播(bō)报,自动(dòng)上传预警信息。目前,该机器人(rén)已在北京(jīng)、广州、青岛、成(chéng)都等地落地使用。
“小易小易,上(shàng)楼”“小易小(xiǎo)易,去10楼”,在北(běi)京海淀医院的电梯里,只需要(yào)一句简单的(de)指(zhǐ)令,就(jiù)能实(shí)现乘(chéng)梯上下楼,全程免(miǎn)按键,实现零(líng)接(jiē)触。
“声智(zhì)科技研发(fā)的智慧语(yǔ)音电梯,融合语(yǔ)音(yīn)与图像等交互技术,不(bú)依赖手机、IC卡等设备,无论使用(yòng)者(zhě)是(shì)在电梯外,还是在电梯轿厢内,都(dōu)可以通过可视化人(rén)机交互方式搭(dā)乘电梯(tī)。”常乐介绍,这方便(biàn)了老人、儿(ér)童等用户的日常生活,在疫(yì)情防(fáng)控期间还有(yǒu)效降低了(le)接触传播感染(rǎn)风(fēng)险。
目前,声(shēng)智科技已推出第二(èr)代AI智能电梯系统,增(zēng)加(jiā)手势(shì)识别功能,残障(zhàng)人士也可以实现免(miǎn)接触控(kòng)制电梯。2021年,为解决电动自行车入户充电的监管难题,减少电池充电爆炸起火等(děng)隐患,企业又迭代推出了第三代(dài)AI智能电梯。
“未来,我们希望AI技(jì)术能满足复杂场景的(de)灵活、大范围应用。”李良斌(bīn)表示(shì),声智(zhì)科技(jì)将继(jì)续加强核心技术(shù)研发,让更多AI产品落地,使万物互联更智能。