IBM 的 AI 人臉識別「訓練數據集」惹官司!

雲風暴 發佈 2020-01-29T02:07:49+00:00

這個名為「Diversityin Faces」的數據集包含從流行的照片共享網站Flickr獲取的數百萬張照片,這些照片採用Creative Commons許可證。

上周晚些時候提起的一起集體訴訟指控IBM使用伊利諾州數百萬人的照片來建立一個人臉識別數據集,卻沒有告知他們。



首席原告Tim Janecyk在法律文書中聲稱,IBM使用了來自Flickr網站的至少七張他拍的照片,並未告知他或被拍攝對象,此舉違反了伊利諾州的《生物特徵識別信息隱私法》(BIPA)。

這個名為「Diversity in Faces」的數據集包含從流行的照片共享網站Flickr獲取的數百萬張照片,這些照片採用Creative Commons(CC)許可證。這意味著可以在各種CC許可證中概述的某些條件下,合法地與第三方共享這些照片,而這些條件幾乎總是禁止將照片用於商業用途。

IBM一直聲稱該數據集用作學術資源,該數據集用於訓練其他人臉識別系統以減少偏見。該數據集不是公開可用的,用戶需要獲得授權才能訪問它。

在絕大多數情況下,這意味著照片是光明正大的。不過在草原州伊利諾州除外,該州對此有自己的特定的州法律。

伊利諾州的BIPA是2008年出台的一部美國州法律,該法律要求收集或以其他方式獲取生物特徵識別信息(比如指紋、視網膜掃描或Flickr照片)的公司企業須事先徵得有關人員的書面同意。

Janecyk及集體訴訟的其他成員要求IBM為未經同意擅自使用的每張照片支付5000美元。

幾個州也有類似的法律,包括華盛頓州和德克薩斯州,但只有伊利諾州允許個人、而不是公司可以因侵權行為向對方索要損害賠償金。

IBM在一份聲明中說:「我們認為,原告訴狀中的指控是毫無根據的,我們打算對這些指控作出有力辯護。」

這可不是IBM的人臉識別軟體頭一回遭到抨擊了。去年,許多Flickr用戶被告知他們的照片被用於訓練人臉識別算法時,大聲反對。照片的所有者發現很難從IBM的數據集刪除自己的照片,也無法從已經提供給研究人員的副本刪除這些照片。

Creative Commons組織對這些報導做出了回應,稱「合理使用允許所有類型的內容可自由使用。」

相關連結:上周美國最高法院駁回了Facebook要求最高法院裁定是否可以根據同一部法律:BIPA就其自己的人臉識別軟體對Facebook提起訴訟的主張。該功能可以掃描照片中的「好友」人臉,並建議標籤以識別其ID身份(關鍵是未經明確同意)。Facebook聲稱該功能沒有造成「實際的危害」。最高法院並不同意。

同樣上周在伊利諾州,另一個人David Mutnick根據伊利諾州的同一部法律對Clearview及其創始人提出了集體訴訟。訴狀要求法院對這家公司實施禁制令,並要求該公司刪除從Mutnick和該州其他居民獲取的任何數據。

關鍵字: