在线直播欧美洲

智東西 | 對話華宇軟件CTO孫明東:解讀十大技術創新,用AI破解傳統法律痛點

發布時間:2020-09-18點擊量:分享到:

來源:智東西

 

在线直播欧美洲    智東西9月17日報道,如今以人工智能、區塊鏈為代表的新興信息技術正滲透到越來越多的行業,法律業亦如是。

    過去數年,全國訴求需求暴漲迅猛,給律師、法官等法律界專業人士帶來更多負擔,如何提高效率成當務之急。

    在立法、守法、執法、司法四大體系中,存在大量重復性、低價值、可標準化的流程,比如卷宗信息自動歸目、有效證據提取分析等,這些環節可以通過大數據、人工智能(AI)等信息技術帶來效率和體驗上的飛躍。

在线直播欧美洲    而滿足法律對信息化的訴求,需要既懂科技、又了解法律的企業,像華宇這樣的法律科技行業巨頭應運而生。

在线直播欧美洲    就在上周日,華宇舉辦了一場2020法律科技大會,現場分享其面向法律行業的十大創新技術,并探討法律科技的發展方向和未來機遇。

在线直播欧美洲    大會期間,北京華宇信息技術有限公司副總經理、北京華宇軟件股份有限公司CTO孫明東接受了智東西等少數媒體的采訪,就華宇的核心技術布局和應用碩果、人工智能在法律行業落地的差異化需求、法律科技的當前發展水平和面臨挑戰進行深入交流。

 

一、疫情催化法律行業的數字化智能化普及


    英國倫敦法律顧問公司Jomati Consultants在一項研究《文明2030:不久將來的律所》中提出,在15年內,機器人和AI將會主導法律實踐,也許將給律所帶來“結構性坍塌”,法律服務市場的面貌將大為改觀。

在线直播欧美洲    一方面,迅猛增長的訴訟需求使法律行業空前承壓;另一方面,AI等新興技術帶來了優化業務的效率的可行方案。在行業需求和技術發展的雙重驅動下,法律服務正走向智能化、自動化。

    深耕法律科技近20年的華宇尤其感受到這種變化。

在线直播欧美洲    據華宇軟件CTO孫明東介紹,華宇一直嘗試通過信息化技術,實現法律業務的流程化、規范化。

在线直播欧美洲    最初華宇的法律科技業務從做審判管理起步,主要搭建對內服務法官、檢查官的單一數據管理系統。而隨著移動互聯網、大數據、AI等新興信息技術浪潮的涌來,法律科技的范疇逐漸拓展到從法律檢索、文件審閱、證據分析、提供量刑建議、案件結果預測等諸多應用場景。

在线直播欧美洲    今年的疫情尤其催化了法律數字化、智能化的普及。

    由于疫情期間線下活動不便,依托大數據、人工智能的中國移動微法院應用為人們提供了很多便利,它能幫助人們在網上完成立案、審判、執行等全流程、全業務電子訴訟服務。

在线直播欧美洲    同樣受疫情影響,人們無法到法院開庭,互聯網庭審趨于流行。當事人、代理人、法官等都在各自的電腦前,很多背景比較家居,與法庭以往莊嚴肅穆的格調不符。而通過AI虛擬背景替換,這些參與者的背景可以被切換成莊嚴的虛擬法庭場景。 

    與其他行業相比,法律業務場景中充斥著浩繁的卷宗,這使得法律人工智能面臨數據方面的獨特挑戰。

    法律卷宗通常為掃描件,有證據圖片、合同、欠條、收據、營業執照、律師證等等,對這些數據進行OCR文字識別,會面臨卷宗中存在大量圖釘、指紋、印發體和手寫體混合排版、黑邊、噪點等挑戰。相較常規的OCR技術,應用于法律行業的OCR文字識別需要具備更強的技術能力。

    孫明東告訴我們,在法律科技領域,技術的價值最終體現在業務上的創新,業務創新主要體現在應用創新、產品創新、服務創新上,而技術創新是業務創新的原動力。

    也正是基于這一觀點,華宇一直兼顧法律科技的創新以及與業務需求的緊密結合。

    截至目前,華宇2018年推出的法律人工智能平臺,已經為法律行業提供110+業務應用場景的203個智能點支持,應用于全國24個省、自治區、直轄市的1000余家客戶單位。

在线直播欧美洲    在今年疫情期間,華宇推出的云間互聯網視頻一體化法律服務平臺,已助力全國法院累計開庭次數超過36W+,開庭時長超過35W+小時,開通服務的包括最高人民法院及31個省(自治區、直轄市)2517家法院、13844間法庭。

 

二、華宇的核心優勢:懂法律,還懂技術

 

    孫明東談到,IT人與法律的溝通是長期的挑戰,一個是自然科學,一個是人文社會科學,要將兩者對接起來并非易事。

在线直播欧美洲    為此,華宇于四年前成立了法律人工智能研究院,成員中既有法官、檢察官、律師等從一線來的法律界專家,也有IT、人工智能領域的專家。將兩類專家聚集在一起后,IT專家能夠理解法律的業務,再轉換成規則、邏輯,為法律人工智能提供更好的技術支撐。

    “我們用最先進的技術在解決最傳統的問題。”孫明東說。

    基于近20年在法律科技領域的積累,華宇建立了自己的知識體系,在法律場景的廣度與深度上深入鉆研,具備將核心技術快速迭代和應用到法律特定業務場景中的能力。 

    為了滿足不同法律部門的訴求,華宇深入了解上下游相關部門的特殊需求,形成了不同場景的個性化方案。

    針對法院行業,華宇打造了“人民法院大數據管理和服務平臺”,全面覆蓋了全國3500多家的法院,服務全國12萬名法官。

在线直播欧美洲    針對地方級法院,華宇聯合北京法院打造了“睿法官”,用AI模擬真正的法官思考,代替法官完成一系列伴隨式、精準式司法審判事務性工作,讓法官將更多時間精力投入到司法審判工作。

在线直播欧美洲    針對檢務工作,華宇基于大數據和AI技術研發了智能辦案輔助系統,在北京、貴州、浙江、湖北、廣東等地均已落地應用;其自主研發的智能證據審查技術,可有效輔助檢察官通過技術手段審查證據。

    針對司法行政,華宇深度參與司法部“數字法治、智慧司法”信息化新體系的研究與制定,以智慧調解大數據應用率先打造“數字法治、智慧司法”的第一個示范性業務升級模板。

    此外,華宇還與北大英華,以及百度、阿里、騰訊等公司合作,將在司法領域打造的產品和解決方案,向立法、執法、守法、監察等法律相關領域延伸,希望可以打造一個貫通和連接各個法律機關、人員和活動的法律科技網絡,為新一代法律服務提供基礎技術支撐。

在线直播欧美洲    為了推進法律科技生態建設,華宇搭建了一體化法律服務平臺,深度融合5G、AI、大數據、互聯網、區塊鏈等技術,形成連接立法、司法、執法、守法全領域、全場景的法律科技網絡。

在线直播欧美洲    其核心的法律人工智能平臺包含四部分,分別是華宇區塊鏈平臺“智鏈”、華宇大數據管理平臺“睿元”、華宇人工智能認知平臺“睿核”和華宇人工智能感知平臺“智核”。

在线直播欧美洲    其中,“智核”側重感知,包括OCR、語音識別、視頻分析、虛擬背景替換等技術;“睿核”側重感知,主要是華宇元典團隊做的知識圖譜構建,可實現讓計算機理解法律文書、案件推薦、量刑參考等能力。

    同時,基于區塊鏈的可信數據及可信計算環境,連通了公檢法司、政法委及外部協作權威機構,形成了連接2G、2B、2C的各個場景、覆蓋全行業的司法高可信業務協同生態體系,為法律科技生態建設奠定基礎。

在线直播欧美洲    在華宇看來,圍繞該平臺“產學研用”展開創新,并加強法律科技人才培養,將有助于形成開放、合作共贏的生態。 

 

三、華宇法律科技十大創新技術

 

在线直播欧美洲    華宇在法律科技領域輸出的上述成果,均建立在其核心技術的基礎之上。 

在线直播欧美洲    華宇研究院(北京及上海分院)多年來專注于前沿技術的創新研究工作,其配置的6大實驗室——信創實驗室、2048實驗室、多媒體實驗室、大數據實驗室 、云計算實驗室、移動安全實驗室——均在法律科技相關技術方面取得了重要成果。

在线直播欧美洲    經過多年持續發力技術領域,如今華宇已經重點突破了面向法律行業的多項技術瓶頸,形成了專屬的法律科技十大創新技術。 

1、法律知識圖譜技術

在线直播欧美洲    知識圖譜對于防止冤假錯案大有裨益。基于中國裁判文書網實時更新的文本,針對高達9000多萬篇文書,華宇利用自然語言處理、知識圖譜等技術將法律知識點構建成完整的法律知識中心,使機器認知法律概念、模擬法律推理。

    孫明東介紹說,通過將新的案情與歷史案情進行參考分析,機器可以為相對缺乏判案經驗的年輕法官提供精準的量刑參考,也能讓法官的自由裁量范圍有所收窄。

在线直播欧美洲    知識中心涵蓋法律要素(知識)數量超過1.9萬項,實現了對公、檢、法、司、仲裁等多個行業100多類文書進行信息項提取。

在线直播欧美洲2、基于法律行業的OCR文字識別技術

在线直播欧美洲    在司法領域,華宇材料及文字識別技術重點在卷宗自動歸目及智能編目、信息回填、智能閱卷、卷宗優化及卷宗巡查等場景進行了深度應用。 華宇基于AI深度學習算法,利用圖像分析、字符識別等技術,對材料中的圖片內容分析處理。

在线直播欧美洲    目前其材料識別技術支持識別6700余類材料,其ICR技術可有效地對材料中紅章、手印、二維碼、頭像等20余類關鍵目標進行檢測提取;邊緣檢測法、虛擬化檢測法、圖像增強等技術可優化處理材料的黑邊、空白頁、像素低、噪點等問題,綜合識別準確率不低于98%。

3、基于特征的圖像視頻識別技術

    華宇視頻識別和行為分析技術實現了庭審視頻巡查、訊問行為監控、監所視頻行為監控等功能,可對人體的18或25個關節點信息運作進行識別,并可結合目標檢測策略(基于改進后的Yolo v3架構)完成特定目標的檢測、特定場景異常行為檢測與預警等12類行為檢測。

在线直播欧美洲    對未穿法袍、遲到、離席、人數不足等20-30種庭審違規內容巡查,華宇視頻識別技術的識別準確率在97%以上;對下蹲、坐著、站立、舉手、打電話、抽煙、沖突、摔倒等監所、訊問危險動作和異常行為的識別預警,準確率達到85%以上。

4、多場景多語種司法語音識別技術

    華宇語音識別技術重點在審委會、庭審語音筆錄轉寫等場景進行了深度應用,通過國家評測中心(CNAS)認證識別率達到98%,轉寫效率小于100ms。

    具體而言,該技術重點攻克了人名、地名、法律法規等熱詞的準確識別,1小時音頻在10分鐘左右轉寫完成,在司法特定普通話場景識別上準確率高達98%以上;同時支持四川、河南等20多個省的方言口音,對藏語、維語等少數民族語音識別率為85%以上。

5、面向行業的多元審判虛擬現實技術

    華宇多元審判虛擬現實技術重點在虛擬法庭、互聯網庭審(云庭)等場景進行了應用。 

    基于深度學習的輕量級分割模型,華宇讓線上虛擬法庭可以完成庭審視頻中人體圖像與背景的分割,人像分割在包含4萬張人像分割數據的開源數據集上的準確率達97%,并虛擬化呈現國徽、法庭、席位人員名稱,構建出嚴肅、認真的線上庭審環境,同時結合遠程視頻會議加入多方當事人,可滿足多種環境下的虛擬法庭需求。

在线直播欧美洲6、海量多元異構法律數據深度融合與管理技術

在线直播欧美洲    基于海量多元異構法律數據的深度融合與管理技術,華宇在司法領域實現了多源數據中人–案–物主數據實體的深度關聯融合與關聯關系構建,有效提升數據利用價值。 

    該技術可自動化數據資源的采、存、管、通,實現了從數據集成調度、存儲監控,到數據資源目標管理、元數據管理、主數據管理、再到數據質量管理、數據安全管理、平臺運維管理的數據全生命周期管理。

在线直播欧美洲    比如,基于融合規則的自動化數據融合技術,提升了適應復雜數據融合場景的融合規則準確性,以及增量數據融合技術和億級以上數據量級的融合性能,可應用于法院大數據智慧畫像–當事人畫像、智能報表系統、檢務決策系統、檢察官業績考評系統、大數據輔助民事訴訟監督、監獄罪犯畫像、監察委情報分析系統等產品。

    今年,華宇推出第三代審判管理系統。據孫明東介紹,華宇每年都會投入幾千萬元來推進此類產品的研發,目前已投入大約三四年,現在正逐步為客戶上線,從今年底到明年,這些系統將會大范圍、大面積的鋪開。

7、PB級數據高性能高可靠存儲計算技術

    基于MPP+Hadoop混合技術架構,華宇實現了結構化數據、文件數據、日志數據、互聯網數據、音視頻等各類型數據的高性能、高可靠存儲和計算;實時的數據存儲計算組件,可支撐高并發流式數據實時存儲和計算;支持從GB到PB級數據量快速查詢與分析;高可擴展性,可靈活增加集群節點數量,線性提高系統處理能力;并支持存儲計算組件的統一可視化運維管理。

    在該技術的支持下,華宇助力最高人民法院建設的跨層級、跨地域、跨系統、跨部門、跨業務的大數據管理和服務平臺,每5分鐘動態匯聚全國3502家各級法院的案件、文書和卷宗信息,按月、按年自動生成570萬張報表,實現了司法統計歷史上報表數量最多、一次性服務單位最多、生成效率最快等“三個之最”。

    目前該平臺已累計匯聚全國法院1.99億件案件信息、4.38億份文書、6494萬份電子卷宗、3367萬份電子檔案、其他數據4.5億條,成為全世界最大的審判信息資源庫。

8、潛在與隱形法律實體關系智能發現技術

    基于法律知識圖譜,華宇在海量的數據中逐步挖掘潛在的與隱形的法律實體關系,包括全量的“人-案-律師-企業-法官-法院……”等的關聯關系,逐步構建完整的證據鏈條、實體畫像等,使得虛假訴訟智能發現、證據智能審查等機器智能變成可能。

在线直播欧美洲    通過機器智能輔助審查,自動拆分待審事實,提取待審證據,可降低60%的法官審查時間。

9、面向司法審判閉環的個性化知識智能輔助技術

在线直播欧美洲    基于知識輔助技術,華宇在刑事案件辦理中根據案情進行智能化量刑分析,實現了對400多萬公開刑事裁判文書全面挖掘分析,推送具有類似量刑情節的量刑結果和真實案例,并提供分析報告。

    目前,華宇基于知識圖譜的量刑建議在最常見的10種刑事案件量刑分析準確率高達90%。法律知識圖譜可實現面向用戶的基于案情的個性化司法知識輔助推薦(法律智庫),覆蓋案件審理全過程,包括案例推薦、法條推薦等10多個輔助應用。

10、基于跨專業語言表達的法律思維智能交互技術

    華宇基于跨專業語言表達的法律思維智能交互技術主要應用于法律文本解析、文書智能服務等產品。 

司法領域不同的人員和群體的表達方式不同,可能會造成表達措辭不一致。基于法律知識圖譜的司法語言自動理解解決了該問題,為文書智能生成、智能問答、訴訟材料智能生成等智能應用逐步專業化提供了支撐。

 

四、正推進新的人才機制和培養計劃


    孫明東總結說,華宇推出產品中的大部分技術均為華宇自研,除了上述提及的十大核心技術外,PaaS層的中間件、統計身份認證等等均為華宇自研,華宇也同生態伙伴廣泛合作。

    為了培養更多法律與科技復合型人才,華宇也正在推進一系列新的人才機制和培養計劃。

    目前華宇已形成以CTO孫明東、副總經理米坤、華宇元典總經理鄒劭坤、研究院副院長沈來信等為代表的法律科技專家團隊,發展至今華宇已經擁有超7000名具備法律知識背景的員工。

在线直播欧美洲    華宇與清華大學、北京大學、中國政法大學等全國十幾所高校進行了深度合作,例如與清華大學合作成立法律大數據研究中心,與北京大學合作成立法律人工智能實驗室,以及與政法大學、人民大學、四川大學、東南大學、大連理工和北京交通大學開展課題研究等。 

    談及今后法律科技的發展,孫明東認為,未來五至十年,大數據平臺和人工智能將是兩個關鍵的技術發力點。

    華宇新一代大數據平臺將匯聚更多的數據做融合,做成知識圖譜,對上層提供更有業務價值的數據服務。

在线直播欧美洲    人工智能的研究將不限于OCR、語音識別、人臉識別等感知技術,華宇還將在認知技術方面進行更多投入,比如輔助法官判案子、編寫文書、做量刑決策等。

 

結語:數字法治建設正在提速


在线直播欧美洲    法律科技正搭建起法治中國的新一代基礎設施,尤其在今年疫情的催化下,線上查案、庭審等新形態的業務模式層出不窮,人工智能、大數據等新一代信息技術正為法律行業注入更多新鮮的技術血液,提供更多的能力支撐和智能服務。

在线直播欧美洲    以往可能需要10個實習生去做的工作,AI幾分鐘內就能完成,諸如此類的效率提升為法律行業帶來了許多業務工作流程的優化。

    如今我國法治建設正高速發展,持續增長的業務需求亟待更多技術創新的參與。法律科技基礎設施的建設,既離不開信息基礎設施巨頭,也需要像華宇這樣長期深耕法律科技的行業專家,將技術與科技做深度融合,針對法律行業的剛需提供行之有效的增效方法,推動法律業務走向高效化、標準化。

在线直播欧美洲    由于涉及的業務場景相對復雜,法律科技的推進是一個漫長的過程,孫明東坦言,要讓計算機完全覆蓋到法律傳統問題的方方面面,實現起來難度很大。

 


法律聲明 網站地圖 聯系我們

©Thunisoft 北京華宇信息技術有限公司 版權所有    京ICP備13006480-3