博鱼官方网页版-博鱼(中国)




  1. 咨询热(rè)线:021-80392549

    博鱼官方网页版-博鱼(中国) QQ在线 博鱼官方网页版-博鱼(中国) 企业微信
    博鱼官方网页版-博鱼(中国)
    博鱼官方网页版-博鱼(中国) 资(zī)讯 > 人工智能 > 正文(wén)

    算法偏见:被AI算法包围的(de)时代

    2019/12/31418

    前言:人(rén)工(gōng)智能在各个领(lǐng)域(yù)似乎被吹捧(pěng)为在各(gè)种应用领域实现自动化决策的“圣杯”,被认为(wéi)可以做得比人类更好或(huò)更快,但事实(shí)上人工(gōng)智能面临(lín)了一(yī)个大挑战就(jiù)是(shì)算法偏见。


    Ai芯天下(xià)丨分析丨算法偏见:被AI算法包围的时代(dài)portant;" />

    人工(gōng)智能是否全能

    机器是(shì)没有情感的,只能根据输入的数据来进行学习(xí),然后按照既定设计(jì)完成相应功(gōng)能,AI需要大量数(shù)据来(lái)运作,但(dàn)通常没有合适的数据(jù)基础设施(shī)来支(zhī)持AI学习,最终AI的数据基(jī)础(chǔ)不(bú)够,无法真正有效地完成功(gōng)能,更(gèng)多的是从事一些指令性的工作,就像生产线上的机器手一样,都是提前输入指令,由机器手臂按照固定的步骤操作完成。

    人(rén)类(lèi)对大脑还是未知的,我们(men)并不清楚大(dà)脑(nǎo)是如何进行学习和工(gōng)作的,AI其实就是模仿(fǎng)人脑去思考和工作,但(dàn)我们对(duì)大脑的机理(lǐ)并不清楚,就无法让(ràng)AI完全模拟人脑,无法完全代替人(rén)脑去学习(xí)和工(gōng)作,AI更多时候是根据输入的(de)数据,将见(jiàn)到的问题录(lù)入与(yǔ)已输入的数据进(jìn)行(háng)对比,有(yǒu)重叠度比较(jiào)高(gāo)的(de)就认为匹配成功(gōng),执行相(xiàng)应的预设动作,当已(yǐ)有的样本(běn)库里没有匹配到,那AI也(yě)不知道该怎么办。在很(hěn)多人(rén)类活动中,掺杂着很(hěn)多复杂的社会问题,比如说种族歧视、国家竞争、疾病传染等问题(tí),AI显然还意识(shí)不(bú)到这些问题(tí)的(de)存在,这些(xiē)数(shù)据不好采集和(hé)录入(rù),AI算法也没有考虑这些社会因素。

    Ai芯天下(xià)丨分(fèn)析(xī)丨(shù)算法(fǎ)偏见:被AI算(suàn)法包围的时代portant;" />

    算法的(de)偏(piān)见来(lái)自哪里

    工(gōng)程师很少刻意将偏(piān)见教给算法,那偏见究竟从何而来,这(zhè)个问(wèn)题与人工智能背后的核心技术(shù)—机器学习休戚相关。机(jī)器(qì)学(xué)习过程(chéng)可(kě)化约为如下(xià)步骤,而为算法注入偏见的主要有三个环节—数(shù)据集构建、目标制定与特征(zhēng)选取(工程师)、数据标注(标注(zhù)者)。

    Ai芯天下丨分析丨算(suàn)法偏见(jiàn):被AI算法包围的时代(dài)portant;" />

    工程(chéng)师是规(guī)则制定(dìng)者,算法工程师从头到尾参与了(le)整(zhěng)个系统(tǒng),包括:机(jī)器(qì)学习的目标(biāo)设(shè)定、采用哪(nǎ)种模型、选取什么特征(数据标签)、数据的预(yù)处理等。不恰当的(de)目标设定,可能从(cóng)一开始就引入了(le)偏见,比(bǐ)如意图通过(guò)面(miàn)相来识别罪犯(fàn);不过(guò),更典型的(de)个(gè)人偏见代入,出现在数(shù)据特征的选(xuǎn)取环节。

    数据标签就是一堆(duī)帮助算法达(dá)成目(mù)标的(de)判定因素(sù)。算法就好像一只嗅探犬,当工程师向它(tā)展(zhǎn)示特定东西(xī)的气味后,它(tā)才能够更加精(jīng)准地找到目标。因此工程师会在数据集中(zhōng)设置标签,来决定算法要(yào)学(xué)习该数(shù)据集内部的哪些内容、生成怎(zěn)样的模型。

    对(duì)于一些非(fēi)结构(gòu)化的数据集如(rú)大量描述(shù)性文字、图片、视(shì)频等,算法(fǎ)无(wú)法对其进(jìn)行(háng)直接分(fèn)析。这时就(jiù)需要人工为数据进行标(biāo)注,提炼出结构化的维度,用于训练(liàn)算法。举一个很(hěn)简单的例子,有时(shí)Google Photos会请你(nǐ)帮(bāng)助判断(duàn)一张(zhāng)图片是否是猫,这时你就参与了这张图片(piàn)的打标环节。

    当打标者面对(duì)的是“猫或狗”的提(tí)问时,最坏结果不过是答错;但(dàn)如(rú)果(guǒ)面(miàn)对的是“美或丑”的拷(kǎo)问(wèn),偏见(jiàn)就产生了。作为数据的(de)加(jiā)工(gōng)人(rén)员(yuán),打(dǎ)标(biāo)者时常会被要求(qiú)做一些(xiē)主观价值判断,这(zhè)又成(chéng)为偏见的一大(dà)来源。

    打(dǎ)标过程正是将个人偏见转移到数据(jù)中,被算法吸纳,从而(ér)生成了(le)带(dài)有偏见的模型(xíng)。现(xiàn)如今,人工打(dǎ)标服(fú)务已成为一(yī)种典(diǎn)型商业(yè)模式(shì),许多(duō)科(kē)技(jì)公司都(dōu)将其海(hǎi)量的(de)数据外(wài)包进行打标。这意味着(zhe),算法偏见正通(tōng)过一种(zhǒng)“隐形化”、“合法化”的过程,被流传和放大。

    Ai芯天下丨分析丨算法偏见(jiàn):被AI算法(fǎ)包围的时代portant;" />

    人工智能偏见的分类(lèi)

    偏见不是以一(yī)种形式(shì)出现的,而(ér)是有各种(zhǒng)类型的。这包(bāo)括交互(hù)偏见、潜意识偏见、选择偏见、数(shù)据驱动的偏见(jiàn)和确认偏(piān)见。

    交互偏见(jiàn):是指用户由于自己与算法的交(jiāo)互方式而使(shǐ)算法(fǎ)产生的(de)偏(piān)见。当(dāng)机器被(bèi)设置(zhì)向周围环境学习时,它(tā)们(men)不能决(jué)定要保留或者(zhě)丢弃哪些数(shù)据,什么是(shì)对(duì)的,什么是错(cuò)的。相反,它们(men)只能(néng)使用提(tí)供给它(tā)们(men)的数据——不论是(shì)好的、坏(huài)的,还(hái)是丑(chǒu)的,并在此基础上做出(chū)决策。机器人Tay便是这类(lèi)偏见的一个例子,它是受到一个网络聊天社区的影响(xiǎng)而变得(dé)偏(piān)种族(zú)主义。

    潜意识偏(piān)见:是指算法错(cuò)误地把观念与(yǔ)种族和性(xìng)别等因素联(lián)系起来。例(lì)如,当搜索一名医生的图像时,人工智能会(huì)把男性医生的图像呈(chéng)现给一(yī)名(míng)女性,或者在(zài)搜索护士时(shí)反过来操(cāo)作。

    选择偏见:是指用(yòng)于训练算法的数(shù)据(jù)被倾向性(xìng)地用于表示一个群体(tǐ)或者分组,从而使(shǐ)该(gāi)算法对这些(xiē)群体(tǐ)有(yǒu)利,而(ér)代价(jià)是牺牲(shēng)其他群体。以招(zhāo)聘(pìn)为例(lì),如果人工智(zhì)能被训练成只识别男性的简历,那么女性求职者在申请过程中就很难成功(gōng)。

    数据驱动的(de)偏见:是指用来训练算法的原始数(shù)据(jù)已经存在偏见(jiàn)了。机器就像孩(hái)子一样(yàng):他们(men)不会质疑(yí)所给出的数据,而只(zhī)是寻找其中的模式(shì)。如(rú)果数据在一(yī)开始就被曲解,那么其输出(chū)的结果也(yě)将(jiāng)反(fǎn)映出这一点(diǎn)。

    确(què)认(rèn)偏见:这类似于数据驱动的(de)偏见,偏向于(yú)那(nà)些(xiē)先入为主的信息(xī)。它影响人们怎样收集信息,以及人们怎样解读(dú)信息。例如,如果自己觉得8月份出(chū)生的(de)人比(bǐ)其他(tā)时(shí)候出生的更富有创造性,那就会偏(piān)向于(yú)寻找(zhǎo)强化这种想法的数据。

    Ai芯天下丨分析丨算法偏见:被AI算法包(bāo)围的时代portant;" />

    Applause推出偏(piān)见解决(jué)方(fāng)案(àn)

    应用测试(shì)公(gōng)司Applause推出了新的人工智能解(jiě)决方案,同时提供(gòng)AI训练(liàn)所需的庞(páng)大数据(jù)。

    Applause已经(jīng)为(wéi)其应用程序测试解决(jué)方案(àn)建立了庞大(dà)的全球测试社区,该解决方案受到谷歌、Uber、PayPal等品(pǐn)牌的信任。

    具体(tǐ)地说,Applause的新解决方案跨越五种独(dú)特的AI活动类型:

    ①语(yǔ)音:源(yuán)发(fā)声以训(xùn)练(liàn)支持语音的设(shè)备,并(bìng)对这些(xiē)设备(bèi)进行测试,以确保它们能够准确(què)地理(lǐ)解和(hé)响(xiǎng)应;

    ②OCR:提供文档和对应的文本来训练识别(bié)文本的算法(fǎ),并比较打(dǎ)印文档(dàng)和识别(bié)文本的准(zhǔn)确性;

    ③图像识别(bié):交付预定(dìng)义对象和位置的照片,并确(què)保正确识别图片和识别(bié)对象;

    ④生物(wù)识(shí)别(bié):获取生物特征输入,如人脸和指纹(wén),并测试这些输入是否会产生(shēng)易于使用且(qiě)实际有效的体验;

    ⑤聊天机(jī)器人:给出样(yàng)本问题和不同(tóng)的(de)意图让聊天机器人(rén)回答,并与聊天机器人互动,以(yǐ)确保它们能像人类(lèi)那(nà)样准确地理解(jiě)和响应。

    Ai芯天下(xià)丨分(fèn)析丨(shù)算法(fǎ)偏见(jiàn):被(bèi)AI算法(fǎ)包围的(de)时代portant;" />

    结尾:

    但回过(guò)头来,技术不过是社会与人心(xīn)的(de)一面镜子。某种程度上,算(suàn)法偏(piān)见就像在这个我们认为进步、美好的当下,重新呈递灰暗角落的真(zhēn)相并敲响警钟。因此,当谈及算法偏(piān)见的应(yīng)对时,一部分(fèn)努力便是要回归于人(rén)。可幸的是(shì),即便是技术层面的(de)自(zì)律与治(zhì)理尝试,也能极大地降低偏见程度、避免偏(piān)见大幅扩张。

    关键(jiàn)词:




    AI人工智能网声明:

    凡资讯来(lái)源注明为(wéi)其(qí)他媒(méi)体来源的信(xìn)息,均(jun1)为转载自其(qí)他(tā)媒(méi)体,并不代表(biǎo)本(běn)网站赞同其观点,也不代表(biǎo)本(běn)网站(zhàn)对其真实(shí)性负(fù)责。您若对该文章内容有任何(hé)疑问(wèn)或(huò)质疑,请(qǐng)立即与网站(www.baise.shiyan.bynr.xinxiang.zz.pingliang.ww38.viennacitytours.com)联(lián)系(xì),本网站将迅速(sù)给您回(huí)应并做处理。


    联系电话:021-31666777   新闻、技术(shù)文章投稿QQ:3267146135   投稿(gǎo)邮箱:syy@gongboshi.com

    精选(xuǎn)资讯更(gèng)多

    相关资讯(xùn)更(gèng)多(duō)

    热(rè)门(mén)搜(sōu)索

    工博士人(rén)工智能网
    博鱼官方网页版-博鱼(中国)
    扫描二维码(mǎ)关注微(wēi)信(xìn)
    扫码(mǎ)反馈

    扫(sǎo)一扫,反馈当前页面(miàn)

    咨(zī)询反馈
    扫(sǎo)码关注

    微信公众(zhòng)号

    返回顶部

    博鱼官方网页版-博鱼(中国)

    博鱼官方网页版-博鱼(中国)