國際刑警組織新軟件憑聲音就能揪出犯罪分子!
2018-06-08 10:33:44 來源 : 云頭條????????警用裝備網(wǎng)訊: 一個新的平臺旨在將語音錄音與存儲在海量數(shù)據(jù)庫中的語音樣本進行匹配來識別犯罪分子,但這也引發(fā)了隱私方面的問題。
全球最大的警察網(wǎng)絡正在評估這樣一款軟件:可以將來自電話通話或社交媒體帖子的語音樣本與存儲在諸執(zhí)法機構共享的海量數(shù)據(jù)庫中的犯罪分子的語音錄音相匹配。
正如開發(fā)人員所述,該平臺將采用幾種語音分析算法,按性別、年齡、語言和口音來過濾語音樣本。它將由國際刑警組織在法國里昂的總部加以管理,目的是提高語音數(shù)據(jù)的準確性,并提高語音數(shù)據(jù)的可靠性和司法上的可采信性。
開發(fā)團隊已在2017年3月和11月成功完成了系統(tǒng)的現(xiàn)場測試。接下來會于今年6月在布魯塞爾進行項目評估。
雖然該系統(tǒng)可以處理任何“合法截獲”的聲音,包括背景對話,但預期用途是將從電話通話和社交媒體收集的聲音與“黑名單”數(shù)據(jù)庫相匹配。樣本可能來自移動電話、固定電話或VoIP網(wǎng)絡電話的錄音,或者來自從發(fā)布到社交媒體上的招聘或宣傳視頻捕獲的音頻片段。
這些錄制的數(shù)據(jù)實際上成了生產(chǎn)線上的小部件。該文件(即捕獲的語音片段)可能已經(jīng)包含由最初獲取語音片段的執(zhí)法官員添加的一些描述性元數(shù)據(jù)。比如說,軟件隨后會嘗試添加關于說話人的年齡或口音的新信息。
為了幫助完成這項任務,SIIP平臺將創(chuàng)建一個模板(含有電話通話的警方錄音),標記代表該片段上聲音的聲學特征。然后使用那些特征或身份向量,試圖在數(shù)據(jù)庫中找到匹配的對象。
為了開發(fā)該軟件,開發(fā)人員采用了多種算法或模塊,通過一條基于開源架構(http://www.weblab-project.org/index.php?title=WebLab)的處理鏈對剛錄制的語音樣本進行排序。2016年6月、2017年5月和2018年2月發(fā)布的臨時報告聲稱,構建這種系統(tǒng)所面臨的挑戰(zhàn)包括安裝諸多工具,以便過濾背景噪音,提高語音清晰度,隔離聲音,以及為警察總部和外勤的應用輕松共享、收集和分類數(shù)據(jù)。
其目的是能夠?qū)⑿碌恼Z音錄音與可能存儲100多萬條記錄的數(shù)據(jù)庫中存儲的超大聲音樣本數(shù)據(jù)庫進行匹配。該數(shù)據(jù)庫將由國際刑警組織來管理;語音錄音將由這家機構所轄的各執(zhí)法機構來輸入。來自192個國家的這些執(zhí)法機構可以訪問該系統(tǒng)。
該平臺還可以匹配來自各大社交媒體平臺的語音樣本,包括Twitter、Google+、LinkedIn、YouTube和Facebook。通過基于語言相關性和地理位置等搜索標準對多媒體內(nèi)容進行梳理,該系統(tǒng)將標記和處理這些材料,并在數(shù)據(jù)庫中找到類似的片段。該軟件的視頻處理引擎可以從在線視頻中提取音頻,將其分割成單聲道錄音,將格式處理成未經(jīng)壓縮的16千赫茲WAV文件。純音頻內(nèi)容也可以用這種方式來加以搜索和標記。
負責協(xié)調(diào)該項目的是總部位于紐約和以色列的Verint這家“可行動情報”公司。Verint以商業(yè)通話錄音起家,不妨想想“出于質(zhì)量控制和培訓的原因,本次通話可能被錄音。”該公司與空中客車、SingularLogic和Nuance共同開發(fā)了該系統(tǒng),關鍵字識別組件來自維也納Sail Labs和瑞士非營利研究組織IDIAP。荷蘭和英國的安全小組研究了這個項目的倫理道德方面。征集了多個執(zhí)法機構的意見,包括國際刑警組織、意大利警察局、英國大都會警察局、德國聯(lián)邦刑事調(diào)查局和葡萄牙刑事警察局。
與更廣泛的自動語音監(jiān)視領域一樣,該項目引起了復雜的反響。柏林的活動家馬修斯?蒙洛伊(Matthias Monroy)是一家公民權利雜志的編輯,他說:“我認為,警察和秘密情報機構手里的語音識別相當危險。我持有異議。”自SIIP系統(tǒng)在2014年啟動以來,蒙洛伊就一直在密切關注該系統(tǒng)。
保羅?約翰尼斯(Paul Johannes)是德國卡塞爾大學商法系的研究助理,還是柏林數(shù)字隱私組織Forum Privatheit的成員。他表示,執(zhí)法機構一直在尋找工具,對付由犯罪或恐怖活動開發(fā)的新技術。
Human Rights Watch的高級研究員兼中國問題專家瑪雅?王(Maya Wang)最近幫助撰寫了一份報告,批評北京政府借助AI構建語音樣本數(shù)據(jù)庫的工作。不過她表示,政治環(huán)境很重要。她看到了一個三極環(huán)境:一方是中國及“處于蠻荒期”的監(jiān)視,缺少任何有意義的保護措施;一方是歐洲,實施了較嚴格的規(guī)定;另一方是美國,采用較松散的框架,該框架仍與充滿活力的公民社會和法治相關聯(lián)。王認為,自動語音識別帶來的后果取決于該技術用于哪里。
讓事情更復雜的是,歐盟即將頒布《數(shù)據(jù)保護通用條例》(GDPR),這是一系列全面的消費者數(shù)據(jù)隱私法規(guī)。關于該法規(guī)會不會影響SIIP之類的語音識別工具,外界意見不一。約翰尼斯表示,GDPR有一條“被遺忘的孿生”指令,該指令對警方或情報部門處理個人數(shù)據(jù)作了規(guī)定,并為個人數(shù)據(jù)的自由移動制定了規(guī)則。
許多執(zhí)法機構已經(jīng)使用語音識別軟件包。國際刑警組織曾對69個國家的91個警察部門作了一項調(diào)查,結果顯示,一半以上的警察部門已經(jīng)在使用某種類型的自動語音識別系統(tǒng)。
比如說,STC Group提供一套名為VoiceGrid的語音識別套件,該套件于2011年部署在墨西哥,于2015年部署在厄瓜多爾。STCGroup是總部位于俄羅斯的Speech Technology Center的歐洲子公司。STC很注重將所謂的“聲紋”(voiceprint)與底層的原始語音數(shù)據(jù)相分離――萬一含有聲紋的數(shù)據(jù)庫遭到黑客攻擊,識別個人身份的數(shù)據(jù)已被清除。
外界一再要求置評,Verint和國際刑警組織并未予以回復。該系統(tǒng)的目標之一是改善在法庭案子中使用語音識別的前景。消息靈通人士表示,但是如果國際刑警組織繼續(xù)推行SIIP平臺,顯著特征很可能是數(shù)據(jù)庫。
杰弗里?斯圖爾特?莫里森(Geoffrey Stewart Morrison)是英國伯明翰阿斯頓大學司法語言中心的副教授,他表示,在法庭上使用語音數(shù)據(jù)和使用語音識別作為一種調(diào)查工具有很大的區(qū)別。通過已發(fā)表的作品,他和同事已為法庭上的語音比較證詞指出了明確的限制(https://escholarship.org/content/qt5239p0tz/qt5239p0tz.pdf)。
國際刑警組織的這個平臺可能證明它不僅有助于縮小潛在嫌疑人的范圍,還有助于起訴犯罪分子。莫里森表示,個別執(zhí)法機構可能已經(jīng)在購買現(xiàn)有系統(tǒng)以滿足各自的用途,但它們可能不會共享數(shù)據(jù),哪怕是在本國內(nèi)部。然而,國際刑警組織的作用就是促進執(zhí)法機構之間共享信息。
鑒于最近有公司從Facebook之類的社交媒體平臺獲取數(shù)據(jù)這一做法頗讓人擔憂,還可以將這種分析視為一種警告。正如活動家蒙洛伊指出的那樣,普通大眾最近才意識到他們的書面交流內(nèi)容可能大范圍受到監(jiān)視、過濾查找關鍵字。他說:“普通大眾應該知道,這還適用于語音內(nèi)容?!?/p>
新聞稿件歡迎直接聯(lián)系:QQ 34004818 微信公眾號:cpsjyzb
我要評論
0 條評論
- 還沒有人評論過,趕快搶沙發(fā)吧!
最新專題
更多-
-
科技助警,干貨滿載:第八屆警用無人機論壇亮點紛呈!
第八屆警用無人機創(chuàng)新 [ 詳情 ]
- 回顧第七屆世界無人機大會 07-10
- 專題:回顧2022世界無人機大會 01-13