記者 劉園園
人工智能鑒黃技術正從傳統的圖片、視頻、文字,趟進語音鑒黃這片藍海。記者19日獲悉,阿里AI語音反垃圾服務上線公測,它可以通過聲紋識別技術,識別語音中存在的涉黃、廣告等違規信息。
這項服務不僅可以識別中文、日文、英文、俄文等多國語言,還可以識別湖南、湖北、河南、東北、四川、廣東等地方言。
在日常生活中,阿里AI語音鑒黃服務支持離線文件和實時語音流。阿里安全部技術人員介紹,對那些有語義的內容,系統先將語音識別轉成文字,然后再將這些文字跟文本反垃圾模型或關鍵詞庫比對,判斷是否涉黃。對那些無語義的聲音,通過聲紋也能識別出來。
當然,識別多國語言和多地方言的能力,需要進行訓練學習。“可以把它想象成一個機器人,像一個小孩,需要不斷的喂養、訓練、學習,它才具備這樣的能力。”阿里安全部技術人員介紹,比如廣東話,可以用一些粵語電視劇來訓練學習。
今年6月,全國掃黃打非辦通報,多個網絡平臺上存在以ASMR(即自發性知覺經絡反應,主要產品為聲音內容,用于放松、助眠)形式傳播低俗甚至淫穢色情的問題。解決類似這種社會問題,人工智能語音鑒黃技術未來大有可為。