技術編號:8258799
提示:您尚未登錄,請點 登 陸 后下載,如果您還沒有賬戶請點 注 冊 ,登陸完成后,請刷新本頁查看技術詳細信息。 隨著互聯網的快速發(fā)展,網頁已成為一個巨大的、共享的信息資源。目前,網頁數 據大都是以HTML的形式出現,然而HTML缺乏對數據本身的描述,只是通過標簽告訴瀏覽器 如何顯示它所描述的信息,沒有清晰的語義信息。因此,HTML描述的網頁頁面只適合人類 瀏覽,應用程序無法直接解析并使用網頁上的信息。 為了增強網頁信息的可用性,出現了網頁信息抽取技術,它通過某種方式包裝現 有網頁信息源,將網頁上的信息以結構化的形式提取出來,為應用程序使用網頁中的數據 提供了可能。...
注意:該技術已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權人授權前,僅供技術研究參考不得用于商業(yè)用途。
該專利適合技術人員進行技術研發(fā)參考以及查看自身技術是否侵權,增加技術思路,做技術知識儲備,不適合論文引用。
請注意,此類技術沒有源代碼,用于學習研究技術思路。