首頁(yè)>國(guó)企·民企>深·觀察深·觀察
8元買(mǎi)3萬(wàn)張人臉照片 誰(shuí)在搜集、買(mǎi)賣(mài)你的“臉”?
11月初,國(guó)內(nèi)“人臉識(shí)別第一案”引發(fā)了輿論關(guān)于人臉識(shí)別技術(shù)與安全的討論。而不久前,“ZAO”APP的興起也讓AI換臉走入了普通民眾的視野,值得注意的是,AI換臉技術(shù)目前已被應(yīng)用于影視、娛樂(lè)等各方面,甚至是淫穢視頻。這引發(fā)了社會(huì)對(duì)人臉數(shù)據(jù)是否可能被濫用的爭(zhēng)議。
誰(shuí)在搜集你的臉?誰(shuí)在買(mǎi)賣(mài)你的臉?
新京報(bào)記者近日調(diào)查發(fā)現(xiàn),網(wǎng)上有一些私下售賣(mài)人臉數(shù)據(jù)的賣(mài)家,有發(fā)帖者稱(chēng)8元可買(mǎi)3萬(wàn)張人臉照片。有賣(mài)家表示可以提供“更多渠道”的人臉圖片,按照3000元可買(mǎi)24000套人臉照片來(lái)計(jì)算,相當(dāng)于一套只要一毛多。還有賣(mài)家表示,其出售的照片大部分來(lái)自朋友圈,且沒(méi)有取得對(duì)方同意。
北京大學(xué)法學(xué)院教授薛軍告訴新京報(bào)記者,有必要對(duì)人臉識(shí)別設(shè)置門(mén)檻,“人臉信息伴隨著人的終身,一旦發(fā)生泄露風(fēng)險(xiǎn)就特別大,所以要進(jìn)行最嚴(yán)格的保護(hù),首先必須得到用戶(hù)明示同意才能收集,我個(gè)人認(rèn)為有時(shí)得到個(gè)人同意也不行,需要國(guó)家授權(quán)才能收集敏感的生物識(shí)別信息?!?/p>
人臉照片在網(wǎng)上可公開(kāi)下載
部分來(lái)自于網(wǎng)站爬取
人臉照片正在被作為商品售賣(mài)。
新京報(bào)記者在IT社區(qū)、網(wǎng)絡(luò)商城等多個(gè)平臺(tái)搜索發(fā)現(xiàn),有不少人臉照片可供免費(fèi)下載或付費(fèi)購(gòu)買(mǎi)。付費(fèi)金額由帖子發(fā)布者自定,多在10元到20元左右,如有發(fā)帖者表示可以“8元購(gòu)買(mǎi)60名志愿者的每人500張照片,共計(jì)3萬(wàn)張照片”。
記者瀏覽多個(gè)人臉下載帖發(fā)現(xiàn),人臉圖片的上傳者一般會(huì)對(duì)圖片中涉及的人臉屬性進(jìn)行標(biāo)明,如“小孩”、“明星”、“網(wǎng)紅”等。照片場(chǎng)景則多種多樣,有個(gè)人自拍,也有與朋友的合影,而被截取下來(lái)的只有人臉部分的圖片。
據(jù)了解,在IT社區(qū)中可公開(kāi)下載的照片標(biāo)記為外國(guó)研究機(jī)構(gòu)提供的國(guó)外志愿者照片,如有帖子表示“耶魯大學(xué)AR人臉數(shù)據(jù)庫(kù)、卡耐基梅隆大學(xué)PIE數(shù)據(jù)庫(kù)等打包賣(mài)15元”,這些圖片是為了訓(xùn)練人臉識(shí)別專(zhuān)門(mén)搭建的數(shù)據(jù)集,圖片質(zhì)量較好。
不過(guò),也有部分照片來(lái)源于網(wǎng)站爬取。記者下載了13萬(wàn)張標(biāo)記為“網(wǎng)紅”的人臉圖片后,隨機(jī)選取五張照片在百度識(shí)圖搜索后發(fā)現(xiàn),其中一張照片為一名香港藝人。而記者搜索與該藝人名字相關(guān)的圖片后發(fā)現(xiàn),所下載的人臉圖片的來(lái)源五花八門(mén),有的截取自?shī)蕵?lè)新聞網(wǎng)站的新聞圖片,也有博客發(fā)布的博文配圖。值得注意的是,有的圖片來(lái)自于已刪除的博客,但記者仍然可以在搜索引擎搜索到相關(guān)圖片,只不過(guò)源網(wǎng)頁(yè)顯示“內(nèi)容已刪除”。
對(duì)于可直接下載的圖片,有發(fā)布者表示,其提供的數(shù)據(jù)集可以任意拿來(lái)下載研究,“只要?jiǎng)e用在商業(yè)和不正當(dāng)用途就可以了”。
對(duì)此,北京市中聞律師事務(wù)所合伙人趙虎表示,這或存侵犯肖像權(quán)與著作權(quán)的問(wèn)題。“他人公開(kāi)上傳到貼吧或者微博的他人的圖像,只是這些肖像權(quán)人在行使自己的肖像權(quán),如果沒(méi)有明確授權(quán)他人使用的,任何人出于商業(yè)目的而進(jìn)行使用,肯定是會(huì)侵犯他人肖像權(quán)的。除了上傳肖像,還有可能上傳一些自己拍攝的其他圖片。若未經(jīng)著作權(quán)人明確授權(quán)可以使用這些圖片外,還會(huì)涉嫌侵犯他人的著作權(quán)?!?/p>
中國(guó)人民大學(xué)法學(xué)院副教授丁曉東對(duì)此的看法則較為寬松,“我認(rèn)為爬取公開(kāi)的圖片本身沒(méi)有問(wèn)題,比如明星的圖片,但這一行為也需要根據(jù)圖片的來(lái)源和圖片的場(chǎng)景來(lái)認(rèn)定,如果對(duì)微博和好友相冊(cè)等半公開(kāi)圖片進(jìn)行爬取,由于存在生物識(shí)別信息,存在一定風(fēng)險(xiǎn),爬取就需要有一定的限制?!?/p>
有賣(mài)家稱(chēng)人臉圖片“可定制”
3000元可購(gòu)買(mǎi)24000套
新京報(bào)記者發(fā)現(xiàn),由于國(guó)外進(jìn)行人臉識(shí)別項(xiàng)目時(shí)間較早,目前公開(kāi)提供的人臉數(shù)據(jù)庫(kù)的圖片多來(lái)自國(guó)外,照片也以外國(guó)人為主,但對(duì)于國(guó)內(nèi)的人臉識(shí)別研究項(xiàng)目,為讓模型識(shí)別更為精準(zhǔn),最好使用中國(guó)或亞洲面孔的圖片,此時(shí)外國(guó)數(shù)據(jù)庫(kù)的圖片往往無(wú)法滿(mǎn)足需求。
對(duì)此,也有網(wǎng)購(gòu)平臺(tái)上的賣(mài)家提供照片“定制”。新京報(bào)記者在淘寶搜索人臉數(shù)據(jù)集后注意到,某店鋪提供“同人N張人臉數(shù)據(jù)集,超10萬(wàn)人不同角度、不同場(chǎng)景、不同身份、無(wú)遮擋、非名人非網(wǎng)絡(luò)圖庫(kù)”的人臉數(shù)據(jù)庫(kù),還支持“一站式”的數(shù)據(jù)定制服務(wù)。商品詳情介紹顯示,數(shù)據(jù)獲取含有人工數(shù)據(jù)采集、自動(dòng)化數(shù)據(jù)采集、調(diào)研問(wèn)卷收集三個(gè)途徑。
新京報(bào)記者查閱店鋪信息發(fā)現(xiàn),購(gòu)買(mǎi)人臉數(shù)據(jù)的定價(jià)為十元,但具體購(gòu)買(mǎi)多少需要再與店家進(jìn)行溝通。記者根據(jù)店鋪公開(kāi)顯示的手機(jī)號(hào)與賣(mài)家取得了聯(lián)系?!坝行┤艘粌扇f(wàn)個(gè),有些要十萬(wàn)個(gè)。一般都是要一萬(wàn)個(gè)人以上,每個(gè)人五張。”該賣(mài)家表示,“(照片)都是自己采集的?!?/p>
該名店家強(qiáng)調(diào),“所有的照片都是近期的?!敝劣趫D片來(lái)源,對(duì)方表示“大部分來(lái)自于朋友圈,有的是朋友圈一傳十十傳百收集來(lái)的,有的則是直接購(gòu)買(mǎi)的,收集起來(lái)十分費(fèi)勁?!?/p>
隨后,該店家發(fā)送給新京報(bào)記者一組儲(chǔ)存有人臉照片文件夾的截圖,截圖共包含有18張照片,每個(gè)照片均被以數(shù)字編號(hào)命名?!耙粋€(gè)人一元,五張照片,在轉(zhuǎn)賬之前,可以利用遠(yuǎn)程操作來(lái)觀看這些照片。”
值得注意的是,該店家承認(rèn),“這個(gè)(使用照片)肯定沒(méi)有取得人家的同意?!辈贿^(guò),在她看來(lái),這些照片被拿來(lái)做研究并無(wú)不妥?!安皇枪嫉缴缃黄脚_(tái)或公開(kāi)網(wǎng)站,肯定是沒(méi)問(wèn)題的?!?/p>
關(guān)于定制服務(wù),該店客服向記者發(fā)送了“定制”所需維度,包括男女比例、年齡層次比例、國(guó)籍等?!坝衅渌笠部梢哉f(shuō)?!睌?shù)據(jù)集的價(jià)格與以上因素相關(guān)。
據(jù)其介紹,最近詢(xún)問(wèn)此款商品的人并不在少數(shù),至于標(biāo)價(jià)十元只是一個(gè)基數(shù),交易的話還需要簽訂合同,通過(guò)對(duì)公賬戶(hù)轉(zhuǎn)款?!白吖~及簽訂合同是雙方的一個(gè)保障。”
此外,新京報(bào)記者在瀏覽國(guó)外網(wǎng)站時(shí)發(fā)現(xiàn),有不少軟件公司公開(kāi)出售其儲(chǔ)備的人臉數(shù)據(jù)庫(kù),如一家網(wǎng)站儲(chǔ)存有75萬(wàn)張人臉圖片,數(shù)據(jù)共305GB。此類(lèi)包含動(dòng)輒數(shù)萬(wàn)人臉照片的數(shù)據(jù)庫(kù)在網(wǎng)絡(luò)空間并不難查找,且有的數(shù)據(jù)庫(kù)并未對(duì)其圖片來(lái)源是否合法做出明確標(biāo)識(shí)。
新京報(bào)記者通過(guò)在IT社區(qū)人臉數(shù)據(jù)資源帖評(píng)論區(qū)加微信的方式聯(lián)系到一名自稱(chēng)擁有人臉數(shù)據(jù)庫(kù)的賣(mài)家,對(duì)方表示如果支付3000元,可以提供24000套人臉圖像,渠道“多種多樣”。對(duì)于具體的人臉圖像來(lái)源,對(duì)方僅表示是“中國(guó)的”,但沒(méi)有透露更多。
趙虎告訴新京報(bào)記者,非法買(mǎi)賣(mài)人臉圖像等數(shù)據(jù)可能違反《民法總則》《侵權(quán)責(zé)任法》中對(duì)于他人隱私權(quán)、肖像權(quán)的保護(hù)。而國(guó)家機(jī)關(guān)或者金融、電信、交通、教育、醫(yī)療等單位的工作人員利用其掌握的公民人臉數(shù)據(jù),然后進(jìn)行倒賣(mài)的,可能會(huì)構(gòu)成《刑法》規(guī)定的出售、非法提供公民個(gè)人信息罪?!叭绻鞘謾C(jī)APP等非法搜集用戶(hù)相關(guān)信息,則還會(huì)違反《移動(dòng)互聯(lián)網(wǎng)應(yīng)用程序信息服務(wù)管理規(guī)定》的相關(guān)規(guī)定?!?/p>
人臉數(shù)據(jù)的信息泄露風(fēng)險(xiǎn)
專(zhuān)家:從制度上約束,防止信息泄露
在安恒信息安全研究院院長(zhǎng)吳卓群看來(lái),人臉數(shù)據(jù)存在唯一性,如果廠商將人臉數(shù)據(jù)收集以后沒(méi)有規(guī)范化應(yīng)用,一旦泄露可能導(dǎo)致嚴(yán)重的后果。
“人臉識(shí)別本身是方便我們生活的,可以免去我們輸密碼的麻煩,但它最大的風(fēng)險(xiǎn)在于信息泄露,因?yàn)榘ㄈ四樤趦?nèi)的生物識(shí)別具有唯一性,這些唯一性的人臉信息一旦被采集上去,如果沒(méi)有妥善處理,可能會(huì)被濫用。”吳卓群告訴新京報(bào)記者。
10月28日,由于反對(duì)采用人臉識(shí)別的方式進(jìn)入動(dòng)物園,浙江理工大學(xué)特聘副教授郭兵作為消費(fèi)者將杭州野生動(dòng)物世界告上了法庭,該案也成為國(guó)內(nèi)消費(fèi)者起訴商家的“人臉識(shí)別第一案”。2019年11月1日,杭州市富陽(yáng)區(qū)人民法院正式受理此案。
郭兵認(rèn)為,園區(qū)進(jìn)行人臉識(shí)別將收集他的面部特征等個(gè)人生物識(shí)別信息,該類(lèi)信息屬于個(gè)人敏感信息,一旦泄露、非法提供或者濫用,將極易危害包括原告在內(nèi)的消費(fèi)者人身和財(cái)產(chǎn)安全?!案鶕?jù)《消費(fèi)者權(quán)益保護(hù)法》第29條之規(guī)定,園區(qū)收集、使用原告?zhèn)€人信息,應(yīng)當(dāng)遵循合法、正當(dāng)、必要的原則,明示收集、使用信息的目的、方式和范圍,并經(jīng)原告同意;而且,被告收集、使用原告?zhèn)€人信息,應(yīng)當(dāng)公開(kāi)其收集、使用規(guī)則,不得違反法律、法規(guī)的規(guī)定和雙方的約定收集、使用信息。被告在未經(jīng)原告同意的情況下,通過(guò)升級(jí)年卡系統(tǒng)強(qiáng)制收集原告?zhèn)€人生物識(shí)別信息,嚴(yán)重違反了相關(guān)規(guī)定,損害了原告的合法權(quán)益?!?/p>
新京報(bào)就此事致電杭州野生動(dòng)物世界,一名工作人員證實(shí),目前指紋識(shí)別已取消,入園者只能到年卡中心錄入人臉信息,通過(guò)人臉識(shí)別入園。該工作人員介紹,人臉識(shí)別更方便、快捷,“指紋有時(shí)候有點(diǎn)破皮、按(識(shí)別)不出來(lái)的?!睂?duì)于外界對(duì)個(gè)人隱私的擔(dān)憂(yōu),該工作人員說(shuō),“就你入園掃一下(臉)?!彼a(bǔ)充,“指紋也是你的信息,你辦年卡的時(shí)候,身份證也留了,電話也留了,這些也是你的信息呀?!?/p>
吳卓群表示,人臉識(shí)別技術(shù)在技術(shù)上已經(jīng)日趨成熟,在許多圖片識(shí)別上,AI的準(zhǔn)確率甚至可以高過(guò)人工識(shí)別,總的來(lái)說(shuō),技術(shù)是為了方便大家,方便社會(huì),這個(gè)技術(shù)發(fā)展本身還是比較好的,但為了防止泄露的風(fēng)險(xiǎn),有必要從制度層面來(lái)保證人臉數(shù)據(jù)信息的流轉(zhuǎn),或者設(shè)置一個(gè)標(biāo)準(zhǔn)來(lái)規(guī)定我們采集后什么能存,什么不能存,從制度和法律上來(lái)約束,以防止采集后出現(xiàn)信息泄露的問(wèn)題。
北京大學(xué)法學(xué)院教授薛軍告訴新京報(bào)記者,有必要對(duì)人臉識(shí)別設(shè)置門(mén)檻,“人臉信息伴隨著人的終身,一旦發(fā)生泄露風(fēng)險(xiǎn)就特別大,所以要進(jìn)行最嚴(yán)格的保護(hù),首先必須得到用戶(hù)明示同意才能收集,我個(gè)人認(rèn)為有時(shí)得到個(gè)人同意也不行,需要國(guó)家授權(quán)才能收集敏感的生物識(shí)別信息。”
人臉數(shù)據(jù)可用來(lái)做什么?
多用于研究,大量照片用于AI學(xué)習(xí)
事實(shí)上,早在人臉識(shí)別技術(shù)剛剛興起時(shí),收集大量人臉照片用于機(jī)器AI學(xué)習(xí)就成為了人臉識(shí)別項(xiàng)目研究的“剛需”。
新京報(bào)記者采訪多位從業(yè)者發(fā)現(xiàn),購(gòu)買(mǎi)人臉照片的大多是從事人臉識(shí)別相關(guān)研究項(xiàng)目的工作人員,人臉數(shù)據(jù)被他們用于訓(xùn)練機(jī)器AI的識(shí)別精確度。
AI人臉識(shí)別研究人員劉澤康向新京報(bào)記者介紹,對(duì)于AI人臉識(shí)別從業(yè)者來(lái)說(shuō),擁有幾萬(wàn)張人臉照片并不罕見(jiàn),他每天都需要將陌生人的人臉照片導(dǎo)入到模型之中,對(duì)模型進(jìn)行優(yōu)化。
“火爆異常的AI換臉背后的工作流程并不難理解,用戶(hù)將照片導(dǎo)入后,計(jì)算機(jī)會(huì)通過(guò)網(wǎng)絡(luò)模型對(duì)照片的像素點(diǎn)進(jìn)行調(diào)整,從而生成與影視劇中人物表情及所處環(huán)境、光線等相匹配的人臉,實(shí)現(xiàn)AI換臉。”劉澤康告訴新京報(bào)記者,“為達(dá)到換臉的目的,計(jì)算機(jī)需要對(duì)人臉圖像進(jìn)行大量的數(shù)學(xué)運(yùn)算,如果圖片數(shù)量過(guò)少,模型不夠優(yōu)化,識(shí)別不夠精準(zhǔn),計(jì)算機(jī)便很難較好地實(shí)現(xiàn)識(shí)別功能?!?/p>
新京報(bào)記者發(fā)現(xiàn),劉澤康的電腦中,存放著幾萬(wàn)張的人臉照片。這些圖片被按照相機(jī)種類(lèi)分別儲(chǔ)存在文件夾中。記者隨意點(diǎn)開(kāi)劉澤康電腦中的一個(gè)文件夾,顯示共包含有2855照片。每個(gè)照片的名稱(chēng)分別為其數(shù)字編號(hào),采集場(chǎng)景及人物表情不盡相同,但均為正常拍攝。
據(jù)劉澤康介紹,這些照片大部分是從網(wǎng)絡(luò)公開(kāi)的數(shù)據(jù)庫(kù)中下載的,也有數(shù)量相當(dāng)可觀的一部分系志愿者提供?!罢掌话驹刚呱矸菪畔ⅲ什簧婕扒址腹耠[私或者肖像權(quán)的問(wèn)題?!?/p>
百度一名從事AI學(xué)習(xí)的技術(shù)人員對(duì)新京報(bào)記者表示,從業(yè)者收集大量人臉圖片的目的就是為了機(jī)器學(xué)習(xí)?!斑@本身是一個(gè)很枯燥的過(guò)程,比如拿到一張男性微笑的圖片,你就人工標(biāo)注‘微笑’然后給機(jī)器AI識(shí)別,人工標(biāo)注的多了,AI自然就更加精準(zhǔn)了,目前這些技術(shù)實(shí)際上早已落地,例如火車(chē)站人臉識(shí)別身份證圖片”。
不過(guò),也有從事隱私檢測(cè)的程序員對(duì)記者表示,在擁有人臉識(shí)別功能后,有些機(jī)構(gòu)反而可以更多地截取人臉圖片。“用戶(hù)在進(jìn)行人臉識(shí)別時(shí),機(jī)構(gòu)在技術(shù)上是可以截存用戶(hù)圖片,從而形成自己獨(dú)家數(shù)據(jù)庫(kù)的,而這些截存下來(lái)的圖片有可能他們自己用于訓(xùn)練AI模型,但也不排除用來(lái)買(mǎi)賣(mài)”。
該名程序員表示,原先有許多人臉識(shí)別相關(guān)的AI程序是開(kāi)源的,“很多人甚至連人臉數(shù)據(jù)庫(kù)都不用,可以直接下載已經(jīng)訓(xùn)練好的模型,但自從ZAO引發(fā)爭(zhēng)議后,一些模型和代碼就不再公開(kāi)了,這樣導(dǎo)致了另一個(gè)后果,大家還得自己再找圖片進(jìn)行AI訓(xùn)練?!?/p>
而在劉澤康看來(lái),技術(shù)本身并無(wú)原罪。“沒(méi)有最精準(zhǔn)的人臉識(shí)別,只有更精準(zhǔn)的人臉識(shí)別。以酒店住宿為例,很多人都有過(guò)識(shí)別慢、難識(shí)別、識(shí)別條件苛刻等問(wèn)題。如在目前一些酒店的人臉識(shí)別系統(tǒng)中,對(duì)于佩戴眼鏡等飾品或強(qiáng)光照等條件下,識(shí)別不夠精準(zhǔn),需要一再重復(fù)識(shí)別,研究的意義就在于可以擁有更快更精準(zhǔn)的人臉識(shí)別系統(tǒng)?!?/p>
“AI換臉作為一種新型的技術(shù),各方面配套還有待完善,需要社會(huì)各方向積極方面去引導(dǎo),不能因噎廢食?!眲煽嫡J(rèn)為。
“目前,人臉識(shí)別技術(shù)已經(jīng)被廣泛運(yùn)用于智能門(mén)鎖、移動(dòng)支付、手機(jī)解鎖等,減少竊密、造假、冒用、頂替等可能,提升安全系數(shù);在公司、商場(chǎng)、機(jī)場(chǎng)、學(xué)校等場(chǎng)景下,人臉識(shí)別技術(shù)可以提升管理效率,提升交互體驗(yàn);在刑偵及公共領(lǐng)域,人臉識(shí)別技術(shù)可以協(xié)助抓獲潛逃多年的犯罪嫌疑人,可以幫助失散多年的家庭團(tuán)圓,執(zhí)法效率和社會(huì)公共安全得以大幅提高?!卑俣劝踩偨?jīng)理馬杰對(duì)新京報(bào)記者表示。
新京報(bào)記者 羅亦丹 李大偉
編輯:秦云
關(guān)鍵詞:識(shí)別 照片 圖片 記者 信息
免責(zé)聲明:本文轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),不構(gòu)成投資建議。
更多
更多
- 被動(dòng)式裝配建筑與鄉(xiāng)村振興產(chǎn)業(yè)發(fā)展大會(huì)暨田園綜合體與
- 兩部門(mén):ETC欠費(fèi)超30日將上報(bào)個(gè)人征信
- 工信部:前10月電信業(yè)務(wù)收入累計(jì)完成10973億元
- 8元買(mǎi)3萬(wàn)張人臉照片 誰(shuí)在搜集、買(mǎi)賣(mài)你的“臉”?
- 文明互鑒 民心相通 經(jīng)濟(jì)多贏
- 金融服務(wù)民營(yíng)經(jīng)濟(jì)路上的“三問(wèn)”
- 冬天的約定
- 河北省非公有制經(jīng)濟(jì)商(協(xié))會(huì)黨委召開(kāi)商協(xié)會(huì)黨建工作
- 全國(guó)政協(xié)調(diào)研組內(nèi)部座談會(huì)說(shuō)了幾件事全都是干貨