国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      基于鏈接聚類的無障礙網(wǎng)頁瀏覽方法

      文檔序號:6497209閱讀:328來源:國知局
      專利名稱:基于鏈接聚類的無障礙網(wǎng)頁瀏覽方法
      技術(shù)領域
      本發(fā)明涉及無障礙網(wǎng)頁瀏覽方法的技術(shù)領域,特別是基于鏈接聚類的無障礙網(wǎng)頁 瀏覽方法。
      背景技術(shù)
      世界上約有盲人3000萬人左右,中國約有500萬盲人,占世界總數(shù)的18%,隨著互 聯(lián)網(wǎng)的高度普及和互聯(lián)網(wǎng)在日常生活中重要性的不斷上升,盲人上網(wǎng)問題將成為無障礙建 設中的重要問題。盲人由于無法通過視力接受信息,所以其上網(wǎng)問題特別突出。而且現(xiàn)在 的網(wǎng)站內(nèi)容越來越豐富,頁面結(jié)構(gòu)復雜,尤其是一些大型互聯(lián)網(wǎng)企業(yè),如新浪、搜狐等網(wǎng)站 的首頁,單個頁面中所包含的鏈接就達到了幾百個。面對鏈接數(shù)量如此龐大的網(wǎng)頁,為盲人 提供一種無障礙網(wǎng)頁瀏覽方法顯得尤為重要。為了方便用戶瀏覽方便,現(xiàn)在很多門戶網(wǎng)站都把網(wǎng)頁中的鏈接以主題分類的模式 展現(xiàn)。但是這種分類模式大多依靠網(wǎng)站后臺的人工操作,且一般只應用于網(wǎng)站首頁或者導 航欄。這使得用戶在瀏覽一般網(wǎng)頁時,只能逐個點擊鏈接,查找自己所需的信息。而對于需 要依靠讀屏軟件等輔助工具來瀏覽網(wǎng)頁的盲人用戶來說,逐個點擊鏈接來尋找自己需要的 信息,操作耗時長,網(wǎng)頁瀏覽效率低。

      發(fā)明內(nèi)容
      為了克服現(xiàn)有技術(shù)的盲人閱讀時搜索信息不方便,網(wǎng)頁瀏覽效率低的缺點,本發(fā) 明提供了一種通過幫助用戶快速鎖定同一網(wǎng)頁中的同主題鏈接,以提高瀏覽網(wǎng)頁的體驗度 的基于鏈接聚類的無障礙網(wǎng)頁瀏覽方法?;阪溄泳垲惖臒o障礙網(wǎng)頁瀏覽方法,包括以下步驟
      1)、從互聯(lián)網(wǎng)中抓取網(wǎng)頁,獲取網(wǎng)頁中的鏈接;
      2)、抽取各鏈接對應的URL文本和錨文本內(nèi)容,同時抓取鏈接對應的網(wǎng)頁的文本信息;
      3)、獲取URL文本、錨文本和對應網(wǎng)頁正文中的關(guān)鍵詞,以關(guān)鍵詞為 特征、形式化地將所有網(wǎng)頁鏈接分別表示成由關(guān)鍵詞信息組成的鏈接向量
      P-P = ^1 ^2 Ji L],其中工為鏈接向量多中的第i個關(guān)鍵詞的權(quán)重信息;
      4)、利用聚類算法對鏈接向量>進行聚類,將同主題的連接作為一組,以分組的形式 重新呈現(xiàn)網(wǎng)頁。進一步,步驟3)中所述的關(guān)鍵詞權(quán)重信息J由URL特征權(quán)重<、錨文本權(quán)重< 和網(wǎng)頁文本特征權(quán)重d組成,
      權(quán)利要求
      基于鏈接聚類的無障礙網(wǎng)頁瀏覽方法,包括以下步驟1)、從互聯(lián)網(wǎng)中抓取網(wǎng)頁,獲取網(wǎng)頁中的鏈接;2)、抽取各鏈接對應的URL文本和錨文本內(nèi)容,同時抓取鏈接對應的網(wǎng)頁的文本信息;3)、獲取URL文本、錨文本和對應網(wǎng)頁正文中的關(guān)鍵詞,以關(guān)鍵詞為特征、形式化地將所有網(wǎng)頁鏈接分別表示成由關(guān)鍵詞信息組成的鏈接向量,,其中為鏈接向量中的第i個關(guān)鍵詞的權(quán)重信息;4)、利用聚類算法對鏈接向量進行聚類,將同主題的連接作為一組,以分組的形式重新呈現(xiàn)網(wǎng)頁。2010105220391100001dest_path_image001.jpg,849137dest_path_image002.jpg,2010105220391100001dest_path_image003.jpg,334345dest_path_image004.jpg,721464dest_path_image004.jpg
      2.如權(quán)利要求1所述的基于鏈接聚類的無障礙網(wǎng)頁瀏覽方法,其特征在于步驟3)中 所述的關(guān)鍵詞權(quán)重信息1由URL特征權(quán)重df、錨文本權(quán)重Ji4和網(wǎng)頁文本特征權(quán)重^^組 成,
      全文摘要
      基于鏈接聚類的無障礙網(wǎng)頁瀏覽方法,包括從互聯(lián)網(wǎng)中抓取網(wǎng)頁,獲取網(wǎng)頁中的鏈接;抽取各鏈接對應的URL文本和錨文本內(nèi)容,同時抓取鏈接對應的網(wǎng)頁的文本信息;獲取URL文本、錨文本和對應網(wǎng)頁正文中的關(guān)鍵詞,以關(guān)鍵詞為特征、形式化地將所有網(wǎng)頁鏈接分別表示成由關(guān)鍵詞信息組成的鏈接向量,,其中為鏈接向量中的第i個關(guān)鍵詞的權(quán)重信息;利用聚類算法對鏈接向量進行聚類,將同主題的連接作為一組,以分組的形式重新呈現(xiàn)網(wǎng)頁。本發(fā)明的優(yōu)點是對網(wǎng)頁鏈接進行聚類處理,以使網(wǎng)頁中的鏈接以更緊湊的分組方式呈現(xiàn);適用于所有類型的網(wǎng)頁,無需后臺人工操作,可用于幫助盲人實現(xiàn)無障礙網(wǎng)頁瀏覽,也可用于幫助普通用戶提高網(wǎng)頁瀏覽質(zhì)量。
      文檔編號G06F17/30GK101986297SQ201010522039
      公開日2011年3月16日 申請日期2010年10月28日 優(yōu)先權(quán)日2010年10月28日
      發(fā)明者何占盈, 卜佳俊, 張利軍, 王燦, 陳純 申請人:浙江大學
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1