「智慧」與「知會」上演真假美猴王 鑑定人甄別原始碼一錘定音

北青網 發佈 2022-08-16T07:08:14.970131+00:00

一個是《智慧課堂》,一個是《知會課堂》,不僅名稱相似,就連網課軟體應用內容、教學手冊也如出一轍。「兩個軟體看上去很相似,但僅從軟體界面上來看,無法確定代碼是否相似,必須要對代碼層面進行數據比對,確定兩者的相似度。」

□ 本報記者 余東明

□ 本報見習記者 張海燕

□ 本報通訊員 阮雋峰

一個是《智慧課堂》,一個是《知會課堂》,不僅名稱相似,就連網課軟體應用內容、教學手冊也如出一轍。

這是司法鑑定科學研究院(以下簡稱司鑒院)聲像和電子數據鑑定研究室正高級工程師郭弘辦理的一起軟體相似性鑑定案件。

「兩個軟體看上去很相似,但僅從軟體界面上來看,無法確定代碼是否相似,必須要對代碼層面進行數據比對,確定兩者的相似度。」郭弘打了個比方,這就類似親子鑑定,不是說長得像就行,還得要驗DNA。

這次,司鑒院接受上海市某公安分局委託,鑑定一起涉嫌侵犯商業秘密罪案件中網課軟體的相似度,郭弘是第一鑑定人。

案情並不複雜,犯罪嫌疑人王某實際控制的兩家公司推出了一些學習軟體和一系列網絡課堂,如《知會課堂教師牆》《知會微課助手》《知會課堂》《知會雲平台》等對外銷售。

但實際上,這些學習軟體與上海易教公司的《智慧課堂》《微課大師》《電子書包》《HappyClass》極為相似。易教公司報案稱,王某不惜重金挖走自己公司的高級軟體工程師,他們跳槽後又將具備商業秘密性質的軟體原始碼帶到新公司,重新製作了一套網課軟體。

究竟是否構成侵犯商業秘密,需要專業的司法鑑定機構鑑定軟體的相似度。

對於司法機關而言,這個鑑定結果將成為案子走向的主要依據。

郭弘接手這起案件後,圍繞對檢材和樣本的原始碼進行分析比對,制定了詳細的鑑定方案。

「要比對兩個軟體代碼的相似度,先要排除影響比對的內容,如公共程序庫文件、第三方庫文件和GNU通用公共許可的程序等,這些相當於公用資料庫,大家都可以使用,並不是該軟體特有的。」郭弘說,在比對過程中還應充分考慮名稱(如文件名、變量名、函數名等)、語法(如空白、空格、字符大小寫等)、注釋、順序等差異造成的影響。

在比對過程中,需檢數據不是一成不變的,隨著公安機關偵查的深入,要不斷補充需檢數據。而最考驗鑑定人的是,有些剽竊者會在抄襲代碼時,故意設置「代碼混淆」,比如修改文件的命名方式、某些後綴名、第三方引用等,在實際檢驗過程中,機器無法識別這些混淆的代碼,只能靠鑑定人的經驗甄別。

大概花了近一個月時間,郭弘與委託方多次溝通,在排除涉及到第三方的公共代碼後,再篩選出故意混淆的代碼,最終確定樣本文件中原始碼總行數相似度超過95%,內容完全相同的代碼文件占到總文件數的82.98%,相似度超過90%的代碼文件占到總文件數的96.96%。

「很明顯,兩個軟體原始碼在電子數據層面的相似比例很高。」郭弘說,在軟體相似性鑑定過程中,根據檢材和樣本的情況制定合適的鑑定方案是軟體相似性鑑定科學、規範的關鍵。

為此,司鑒院牽頭制定了《軟體相似性鑑定實施規範》,郭弘便是規範的主要起草人之一。

「隨著信息技術的迅猛發展,電子數據鑑定面臨的挑戰瞬息萬變,整個行業大跨步向前邁進。十多年前,我剛從學校畢業時,電子數據鑑定行業還處於起步狀態,鑑定標準嚴重缺失,幾近空白,完全是鑑定人自己摸著石頭過河。」郭弘說。

那時的郭弘是電子數據鑑定領域少有的女性,每次出席全國性行業學術會議,都會給大家留下深刻印象。

她在調到司鑒院之前,一直在公安部第三研究所工作,辦理過很多「全國第一案」,比如全國首個微博外掛案、全國首個微信外掛案,還有全國最大涉外信用卡詐騙案等。

在郭弘看來,電子數據鑑定意見是一種科學發現、事實描述和經驗判斷。但與傳統鑑定不同,由於電子數據鑑定中的證據具有時效性,有時可能要連續幾天熬夜分析,第一時間規範化檢驗分析,才能確保鑑定結果的準確性。

就個人而言,郭弘認為,電子數據鑑定不僅需要鑑定人的細緻與耐心,還需要豐富的經驗積累。

「現在有越來越多的女性工作者加入電子數據鑑定領域,司鑒院的電子數據鑑定團隊就有幾位出色的女鑑定人,她們是鑑定界的新生力量,也正逐漸成為中堅力量。」郭弘輕快地告訴記者,向陽而生的鑑定人無懼驟雨無懼辛苦,時刻準備著迎接新的挑戰。

如今,她每年仍要辦理數百起案件,幾乎整天泡在實驗室。有人稱她為「專業」的勞模,她爽朗一笑,脫口而出,「完全是因為熱愛啊」。(余東明 張海燕 阮雋峰)

(法治日報)

關鍵字: