用于電子文檔審查的系統(tǒng)和方法
【技術(shù)領(lǐng)域】 [0001] 和背景
[0002] 本發(fā)明總體上涉及電子文檔發(fā)現(xiàn)的領(lǐng)域,且更具體地,涉及用于處理并審查電子 文檔的系統(tǒng)和方法。
[0003] 電子發(fā)現(xiàn)正變成法律程序和管制及內(nèi)部合規(guī)調(diào)查的越來(lái)越重要且昂貴的組成部 分。在提供可能用作為在法律程序或管制或內(nèi)部合規(guī)調(diào)查中的證據(jù)的電子文檔之前,必須 根據(jù)相關(guān)性、保密性等審查并分類(lèi)文檔。
[0004] 電子文檔被處理并呈遞給律師和公司監(jiān)察專(zhuān)員以用于審查的方式對(duì)審查的效率、 準(zhǔn)確性和成本有效性有直接影響。應(yīng)將電子文檔應(yīng)以一致、直觀和容易閱讀的方式顯示給 用戶,且電子文檔應(yīng)是動(dòng)態(tài)可搜索的和可分類(lèi)的。這可能在處理不同的文件類(lèi)型的大量電 子文檔時(shí)特別有挑戰(zhàn)性,在電子發(fā)現(xiàn)中情況常常是這樣。
[0005] 關(guān)于諸如"聊天"消息文字記錄的電子通信文檔,傳統(tǒng)電子發(fā)現(xiàn)方法將這樣的通信 以電子郵件格式呈遞到審查者,因?yàn)殡娮余]件格式通常是由電子發(fā)現(xiàn)處理和審查軟件解決 方案可支持和審查者可識(shí)別的標(biāo)準(zhǔn)化格式。然而,以電子郵件格式的電子通信文檔的呈遞 具有以下缺點(diǎn):審查冗長(zhǎng)的聊天文字記錄文檔審查起來(lái)很麻煩,且為了電子發(fā)現(xiàn)審查的目 的將聊天文字記錄文檔轉(zhuǎn)換成電子郵件格式導(dǎo)致有價(jià)值的元數(shù)據(jù)的損失。
[0006] 即時(shí)聊天發(fā)消息正變成在全世界公司實(shí)體當(dāng)中的合作的越來(lái)越流行的手段。特別 是,諸如證券交易的特定行業(yè)中,即使發(fā)消息軟件允許來(lái)自一個(gè)機(jī)構(gòu)的交易員同時(shí)與在相 同或不同的機(jī)構(gòu)處的很多其他交易員在單個(gè)會(huì)話(即"聊天室")中參與討論。目前,數(shù)百萬(wàn) 即時(shí)消息每天在數(shù)百萬(wàn)用戶之間被交換。這些消息以電子方式被存檔并在法律程序、管制 調(diào)查或?qū)徍似陂g被頻繁地尋找。因此,提供允許用戶快速和方便地在電子發(fā)現(xiàn)期間搜索、過(guò) 濾、審查和分類(lèi)消息而不將消息轉(zhuǎn)換成涉及信息的損失的格式的系統(tǒng)和方法將是有利的。
[0007] 概述
[0008] 因此,本發(fā)明的目的是提供允許將存檔電子通信源文件解析成可由審查者快速、 方便和準(zhǔn)確地搜索、過(guò)濾、審查和分類(lèi)的分開(kāi)的對(duì)話特定文件的系統(tǒng)和方法。本發(fā)明的另一 目的是提供允許對(duì)話特定文件被搜索、過(guò)濾和審查而沒(méi)有元數(shù)據(jù)的損失的系統(tǒng)和方法。
[0009] 根據(jù)本發(fā)明的一個(gè)實(shí)施方式,提供了用于審查電子文檔的方法和系統(tǒng)。系統(tǒng)包括 與審查者相關(guān)的計(jì)算設(shè)備和與電子發(fā)現(xiàn)系統(tǒng)相關(guān)的計(jì)算設(shè)備。發(fā)現(xiàn)系統(tǒng)計(jì)算設(shè)備將電子通 信數(shù)據(jù)源文件解析成一個(gè)或多個(gè)對(duì)話特定文件。對(duì)話特定文件包括消息內(nèi)容和一個(gè)或多個(gè) 元數(shù)據(jù)類(lèi)別。消息內(nèi)容和元數(shù)據(jù)被傳輸?shù)綄彶檎哂?jì)算設(shè)備以用于由審查者審查和分析。審 查者可利用軟件應(yīng)用來(lái)根據(jù)內(nèi)容類(lèi)別過(guò)濾消息內(nèi)容,且動(dòng)態(tài)地為審查者顯示過(guò)濾的消息內(nèi) 容??捎糜谶^(guò)濾消息內(nèi)容的內(nèi)容類(lèi)別包括參與者標(biāo)識(shí)符和參與者-實(shí)體標(biāo)識(shí)符等。
[0010] 在本發(fā)明的另一方面中,對(duì)話特定文件包括第一元數(shù)據(jù)類(lèi)別和第二元數(shù)據(jù)類(lèi)別, 第一元數(shù)據(jù)類(lèi)別是參與者進(jìn)入事件,第二元數(shù)據(jù)類(lèi)別是參與者離開(kāi)事件。系統(tǒng)根據(jù)參與者 進(jìn)入和參與者離開(kāi)事件過(guò)濾消息內(nèi)容,且將過(guò)濾的內(nèi)容動(dòng)態(tài)地傳輸?shù)綄彶檎哂?jì)算設(shè)備以顯 示。本發(fā)明的另一方面包括從消息內(nèi)容過(guò)濾免責(zé)聲明文本和將沒(méi)有免責(zé)聲明文本的過(guò)濾的 消息內(nèi)容傳輸?shù)綄彶檎哂?jì)算設(shè)備以顯示的額外步驟。
[0011] 本發(fā)明的另一方面可包括根據(jù)元數(shù)據(jù)類(lèi)別和元數(shù)據(jù)類(lèi)別值來(lái)搜索一個(gè)或多個(gè)對(duì) 話特定文件的步驟。包括元數(shù)據(jù)類(lèi)別和元數(shù)據(jù)類(lèi)別值的對(duì)話特定文件被傳輸?shù)綄彶檎哂?jì)算 設(shè)備以顯示和審查??筛鶕?jù)各種元數(shù)據(jù)類(lèi)別一一包括會(huì)話持續(xù)時(shí)間、參與者計(jì)數(shù)、參與者標(biāo) 識(shí)符和實(shí)體標(biāo)識(shí)符等一一來(lái)搜索對(duì)話特定文件。
[0012] 在本發(fā)明的又一方面中,審查者計(jì)算設(shè)備接收由發(fā)現(xiàn)系統(tǒng)計(jì)算設(shè)備傳輸?shù)膶?duì)話特 定文件。對(duì)話特定文件包含消息內(nèi)容和至少一個(gè)元數(shù)據(jù)類(lèi)別。審查者計(jì)算設(shè)備將過(guò)濾請(qǐng)求 傳輸?shù)桨l(fā)現(xiàn)計(jì)算設(shè)備,請(qǐng)求根據(jù)元數(shù)據(jù)類(lèi)別過(guò)濾消息內(nèi)容。審查者計(jì)算設(shè)備隨后接收由發(fā) 現(xiàn)計(jì)算設(shè)備傳輸?shù)倪^(guò)濾的消息內(nèi)容。
[0013] 根據(jù)本發(fā)明的另一個(gè)實(shí)施方式,發(fā)現(xiàn)計(jì)算設(shè)備將電子通信數(shù)據(jù)源文件解析成一個(gè) 或多個(gè)對(duì)話特定文件。對(duì)話特定文件包括消息內(nèi)容和一個(gè)或多個(gè)元數(shù)據(jù)類(lèi)別。消息內(nèi)容 和元數(shù)據(jù)類(lèi)別由發(fā)現(xiàn)計(jì)算設(shè)備顯示,且發(fā)現(xiàn)計(jì)算設(shè)備被用于根據(jù)元數(shù)據(jù)類(lèi)別來(lái)過(guò)濾消息內(nèi) 容。為審查者顯示過(guò)濾的消息內(nèi)容。
[0014] 附圖簡(jiǎn)述
[0015] 當(dāng)參考附圖閱讀本發(fā)明的下面的詳細(xì)描述時(shí),本發(fā)明的特征、方面和優(yōu)點(diǎn)將被更 好地理解,其中:
[0016] 圖1是根據(jù)本發(fā)明的一個(gè)實(shí)施方式的示例性硬件配置的示意圖;
[0017] 圖2是涉及即時(shí)聊天消息的交換的示例性通信會(huì)話;
[0018] 圖3示出當(dāng)參與者發(fā)起并終止通信會(huì)話時(shí)產(chǎn)生的以擴(kuò)展標(biāo)記語(yǔ)言格式的通信數(shù) 據(jù);
[0019] 圖4示出當(dāng)參與者交換消息時(shí)產(chǎn)生的以擴(kuò)展標(biāo)記語(yǔ)言格式的通信數(shù)據(jù);
[0020] 圖5示出當(dāng)在通信會(huì)話期間傳輸免責(zé)聲明文本時(shí)產(chǎn)生的以擴(kuò)展標(biāo)記語(yǔ)言格式的 通信數(shù)據(jù);
[0021] 圖6是由擴(kuò)展標(biāo)記語(yǔ)言和個(gè)人存儲(chǔ)表格文件格式支持的通信元數(shù)據(jù)類(lèi)別的比較;
[0022] 圖7示出以電子郵件格式顯示的通信數(shù)據(jù);
[0023] 圖8A-8B示出用于審查通信數(shù)據(jù)的示例性顯示屏;
[0024] 圖9A-9B示出用于過(guò)濾通信數(shù)據(jù)的示例性顯示屏;
[0025] 圖10A-10B示出用于顯示通信元數(shù)據(jù)的示例性顯示屏;
[0026] 圖11A-11B示出用于根據(jù)元數(shù)據(jù)類(lèi)別搜索通信數(shù)據(jù)的示例性顯示屏;以及
[0027] 圖12A-12B示出用于導(dǎo)出通信元數(shù)據(jù)的示例性顯示屏。
[0028] 詳細(xì)描述
[0029] 現(xiàn)在將參考示出本發(fā)明的示例性實(shí)施方式的附圖更充分地描述本發(fā)明。然而,本 發(fā)明可體現(xiàn)在很多不同的形式中且不應(yīng)被解釋為限于下面描述的代表性實(shí)施方式。提供了 示例性實(shí)施方式,從而使得本發(fā)明徹底和完整,并完全傳達(dá)本發(fā)明的范圍和使本領(lǐng)域中的 普通技術(shù)人員能夠制造、使用和實(shí)施本發(fā)明。
[0030] 電子發(fā)現(xiàn)通常指任何過(guò)程,其中電子數(shù)據(jù)被尋找、定位、收集、審查和產(chǎn)生,其意圖 是將它使用為在法律過(guò)程、審計(jì)或調(diào)查中的證據(jù)。術(shù)語(yǔ)"審查者"旨在描述利用本發(fā)明的系 統(tǒng)和方法來(lái)審查電子文檔作為電子發(fā)現(xiàn)過(guò)程的一部分的個(gè)人。術(shù)語(yǔ)"審查者"可與術(shù)語(yǔ)"用 戶"或"方"可互換地使用。術(shù)語(yǔ)"提供者"通常表示提供與電子發(fā)現(xiàn)有關(guān)的服務(wù)的個(gè)人或 實(shí)體。
[0031] 術(shù)語(yǔ)"通信會(huì)話"指在兩個(gè)或多個(gè)通信電子設(shè)備之間的交互式信息交換,并包括例 如電子郵件通信的交換、即時(shí)聊天消息的傳輸或消息在留言板或社交媒體平臺(tái)上的公布。 術(shù)語(yǔ)"通信會(huì)話"與術(shù)語(yǔ)"對(duì)話"、"交換"、"聊天室"或"聊天文字記錄"可互換地被使用。術(shù) 語(yǔ)"參與者"通常描述主動(dòng)或被動(dòng)地被涉及到通信會(huì)話的個(gè)人或?qū)嶓w。與一個(gè)或多個(gè)通信 會(huì)話有關(guān)的以電子方式存儲(chǔ)的信息通常使用術(shù)語(yǔ)"存檔文件"、"源文件"、"電子通信數(shù)據(jù)"、 "對(duì)話特定文件"或"電子發(fā)現(xiàn)數(shù)據(jù)"連同其它術(shù)語(yǔ)被提及。
[0032] 所公開(kāi)的是允許審查者有效和準(zhǔn)確地審查電子通信數(shù)據(jù)作為電子發(fā)現(xiàn)過(guò)程的一 部分而不損失包含在存檔的通信數(shù)據(jù)中的有價(jià)值的信息的系統(tǒng)和方法。在商業(yè)的正常過(guò)程 期間,個(gè)人頻繁地利用電子通信平臺(tái)、這樣的即時(shí)發(fā)消息來(lái)近實(shí)時(shí)地交換信息。將這些通信 的內(nèi)容連同與通信的上下文有關(guān)的元數(shù)據(jù)一起以電子方式存檔。元數(shù)據(jù)可包括例如發(fā)送每 個(gè)通信的日期和時(shí)間,諸如參與者賬號(hào)、相關(guān)商業(yè)實(shí)體的名稱(chēng)和參與者的其它唯一標(biāo)識(shí)符 的用于通信的參與者的識(shí)別信息。所述系統(tǒng)和方法找到關(guān)于對(duì)即時(shí)聊天消息文字記錄的審 查的特定應(yīng)用,但本領(lǐng)域中的普通技術(shù)人員將認(rèn)識(shí)到,系統(tǒng)和方法可被應(yīng)用于對(duì)其它類(lèi)型 的電子文檔和通信數(shù)據(jù)的審查。
[0033] 在電子發(fā)現(xiàn)期間,使用電子發(fā)現(xiàn)軟件將所存檔的通信數(shù)據(jù)收集并處理到數(shù)據(jù)庫(kù)中 以審查和分析。處理步驟通常采用所收集的存檔通信數(shù)據(jù)并打開(kāi)單獨(dú)的電子通信文檔并提 取文本以便于創(chuàng)建可搜索的索引和存儲(chǔ)進(jìn)一步實(shí)現(xiàn)文檔搜索的有價(jià)值的元數(shù)據(jù)??蓪?shù)據(jù) 庫(kù)和電子發(fā)現(xiàn)軟件集成到由電子發(fā)現(xiàn)提供者維護(hù)的計(jì)算機(jī)系統(tǒng)。法律程序或調(diào)查方或他們 的代理為了進(jìn)行審查的目的而遠(yuǎn)程訪問(wèn)電子發(fā)現(xiàn)軟件??蛇x地,可在由一方或一方的代理 維護(hù)的計(jì)算機(jī)系統(tǒng)上實(shí)現(xiàn)數(shù)據(jù)庫(kù)和電子發(fā)現(xiàn)軟件。
[0034] 可審查以類(lèi)似于消息帖子的連續(xù)線程的電子郵件格式的電子通信數(shù)據(jù),消息帖子 包括每個(gè)消息的內(nèi)容、屏幕名稱(chēng)或用于發(fā)起消息的參與者的其它識(shí)別信息及張貼每個(gè)消息 時(shí)的日期和時(shí)間。聊天文字記錄可以且常常包括來(lái)自數(shù)百或數(shù)千參與者的數(shù)千條消息。所 產(chǎn)生的電子文檔可以是難以審查的龐大的多頁(yè)文字記錄。從本地系統(tǒng)檔案庫(kù)收集以電子郵 件格式的電子通信數(shù)據(jù)可以且常常也導(dǎo)致