我們在律所的基礎上,組建了一個叫做“無訟”的團隊,做一些“互聯網+法律”方面的嘗試,目前已經有幾十位伙伴了。這兩年,我經常和數據工程師、程序員們工作在一起。那么,我今天就從法律與技術跨界的角度,結合律師行業在法律大數據方面的探索,從純技術角度,談談我對于司法改革的一些思考吧。
去年9月,國務院發布了《促進大數據發展行動綱要》,已經將大數據應用上升到了國家戰略的層面。說起大數據,可能很多人會首先想到商品零售、金融等領域的應用場景。在我們法律領域,大數據其實也有很多可挖掘、可利用、可產生價值的地方。
總的說來,我覺得法律大數據可能在以下三個方面對司法改革產生積極的作用。
首先,法律大數據可以為司改決策提供數據支持。
舉個簡單的例子,四中全會提出要設跨行政區劃的法院,希望破除地方保護,解決當事人跨行政區劃訴訟難的問題。但問題在于,跨行政區劃的案件,就一定會受到地方干預嗎?我們有過數據支持嗎?
其實,我們團隊對目前已經公開的1800多萬篇裁判文書進行了大數據分析。在提取出跨區域案件數量,跨行政區劃打官司的一方是否敗訴,敗訴率是否高于同一區域同類型案件的當事人等數據之后,我們就可以建立模型,分析跨行政區劃的案件是否有地方保護的情況存在。
據我們了解,目前最高法院的司改部門實際上已經在開始嘗試這樣的一些方法。未來,只要把每年千萬級的案件數據放入數據模型中進行計算,就可以實時監控跨行政區劃案件是否有地方保護的情況存在。
再比如,最高法院的巡回法庭,到底應該設在深圳,設在沈陽,還是設在成都?一個非常簡單的辦法就是,我們來看同一區域內,若干省份的當事人地址距離哪個點最近。通過現在的LBS技術,這樣的計算其實很容易實現,也就能達到便民的目的。
其次,法律大數據可以幫助解決司改進程中遇到的一些問題。
比如說老生常談的“案多人少”問題。有人甚至擔心,因為實行“員額制”以后,這個問題可能會更加突出。
實際上,不依靠技術手段,這個問題根本無法解決。原因在于,在經濟“新常態”下,訴訟案件數量一定會爆發性增長,但法官人數不可能一直增加,“案多人少”問題永遠解決不了。通過技術手段幫助法官提高工作效率似乎是最好的辦法之一。
“無訟”團隊的程序員們正在研發相關產品,通過對裁判文書中的“大數據”進行提煉、分析,可以智能、精準地為法官主動推送與在辦案件密切相關的法律法規、相似案件的裁判文書等信息,在線自動生成文書模板,最大限度減少法官的工作量,從而幫助解決“案多人少”的問題。
再比如說“同案同判”或者“類案同判”的問題。因為每一個法官可能了解的案件數量是有限的,再加上機構、地域等方面的客觀因素制約,在全國范圍內做到“同案同判”十分困難。
但是,通過對海量裁判文書進行分析,找出“相同”案件的裁量尺度,測算出個案的偏離度,對偏離者做出裁判預警,就能促進“同案同判”的實現。
再次,法律大數據可以幫助民眾更好地理解司法改革。
一個個數據本身艱深、枯燥,但是利用數據可視化技術,普通民眾也能輕松讀懂。最高法院發布的《司法公開白皮書》之所以在去年兩會上得到代表委員們的高度認可,其中一個重要的原因就是里面搭配了大量直觀易懂的圖表。
設想一下,如果通過數據可視化技術勾畫出中國法治地圖,那么整個中國的法治現狀就可以一目了然地展現給社會公眾。在這樣的思路下,我們已經嘗試做了中國裁判文書公開的地圖,實時展現全國各地的裁判文書公開情況。
但是,我們也看到,要形成這樣的法律大數據,還面臨著一些困難。
第一,數據采集方式有待提高。
傳統的數據采集以統計為導向,多靠人工錄入。這樣的方式既增加了法官、檢察官的工作量,也因為主觀因素強而存在數據不夠客觀,甚至數據“失真”的問題。同時,由于司法統計的項目往往是滯后的,很難及時收集、分析和利用。因此,我建議徹
底改革司法統計方式,建立一套基于大數據的司法統計方法。
第二,數據的完整程度不夠高。
一方面,目前數據公開的還不夠全面。雖然這兩年法院依托信息化和司法公開,向社會公開了裁判文書,但在審判過程數據等方面的開放程度還不夠,法律大數據無法形成閉環。
另一方面,現有法律大數據中的數據類別還不完整。相比法院,檢察院、公安、司法行政機關的數據公開還有很大的發展空間,律師行業的信息化程度也遠落后于法院。這種狀態長期存在,十分不利于法律大數據的形成。
第三,數據不開放、不貫通。
目前已經形成的數據多被保留在公檢法司各部門內部,而并沒有開放,社會也就很難利用。橫向來看,公檢法司各部門間的數據也尚未貫通,還停留在一個個“數據孤島”的狀態,嚴重制約了法律大數據的發展。
而為了促進法律大數據的形成,推動司法改革進程,我想提出以下三個建議:
第一,充分利用信息化手段采集數據。
法律大數據其實產生于法律人的日常工作之中,法官、檢察官每觸動一下鼠標、敲擊一次鍵盤,都是在生產司法數據。這樣的數據,完全可以通過信息化的手段進行采集。
事實上,由于法官、檢察官、律師等法律工作者的工作成果大多以文書為載體,法律領域的數據也是最有利于信息化采集的。
此外,希望國家有關部門能考慮加大律師行業信息化的投入。一直以來,律師行業的信息化程度遠遠低于法院,這當然有客觀因素,比如說缺乏財政支持、組織體系相對松散等等。但如果加大投入力度,就可以更好地提供采集數據的基礎。
我們現有的技術水平,可以將一篇裁判文書拆解為若干數據段,從中提取有價值的數據。我想,這種技術也可以挖掘律師代理詞、辯護詞等文書中蘊含的大量數據。未來隨著自然語言分析技術的發展,甚至隨著人工智能技術在法律領域的廣泛應用,數據采集、挖掘的能力還會得到進一步增強。
第二,實現司法數據的全面開放,打破數據壁壘。
國務院發布的《促進大數據發展行動綱要》將數據視為“國家基礎性戰略資”,號召政府部門對數據的開發共享。而在法律領域,司法系統內部各部門、各條線間的數據也應該全部貫通,形成完整的法律大數據資源。
因此,司法機關也應當按照國家的戰略部署,把整個司法過程中形成的各種文書全部公開。這樣,就可以通過技術手段從中采集到海量的司法數據,將這些數據資源融會貫通,從而更高效地利用。
第三,鼓勵、引導社會充分利用法律大數據。
法律大數據是全社會的共同財富,民間的創新力量也可以在它的利用上發揮重要作用。比如說,最近中國裁判文書網的改版受到了法律界的交口稱贊,這實際上是在民間先行探索的基礎上,采各家之長的成果。
再比如,由司法行政機關主導的“律師分級制度”爭議極大,但其實,只要司法行政機關開放所有的律師行業信息,這件事情完全可以依靠民間力量和市場調節機制更好地完成。
三個月前,我們的“無訟”團隊嘗試用大數據的方法為律師提供在互聯網上的虛擬身份,生成“律師名片”,為更客觀的律師評價提供基礎。我們設想,如果未來的法律大數據更加全面完整,不僅“律師名片”可以更詳實、客觀,“法官名片”、“檢察官名片”也可以應運而生。
我前不久在西部一個省高院參加信息化建設專家論證會,讓我欣喜的是,當地法院對數據開放的認知程度非常高,對推動建設“法官名片”極有興趣。因為,“法官名片”與“律師名片”可以建立互動互評機制,而在那時,這些互動互評內容本身也會成為法律大數據的重要組成部分。
孟書記及各位領導,我們期待,未來法律大數據的采集、挖掘、分析等相關技術運用到司法實踐中來,可以更好地幫助發現司法工作中的關鍵問題,找出有效對策,從而更有效地提升司法公信力,構建一個法官、檢察官與律師之間相互支持、彼此信任的法律生態圈。
謝謝大家!
信息來源:天同訴訟圈