數(shù)據(jù)處理的方法和設(shè)備的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明實施例涉及數(shù)據(jù)處理領(lǐng)域,并且更具體地,涉及一種數(shù)據(jù)處理的方法和設(shè)備。
【背景技術(shù)】
[0002]手機、可穿戴設(shè)備、機器人等終端設(shè)備,都存在從圖像、視頻、聲音等感知數(shù)據(jù)中識別多種物體、聲音、動作的需求。例如手機要進(jìn)行拍照搜索,需要先識別出所拍照片中的目標(biāo)物品,然后才可以搜索目標(biāo)物品相關(guān)的信息。再例如,機器人要執(zhí)行抓取目標(biāo)物品的任務(wù),需要先通過攝像頭數(shù)據(jù)獲取到目標(biāo)物品在周圍環(huán)境中的位置。
[0003]為了讓終端設(shè)備具備廣泛的識別能力,通常方法為:從大量已知樣本數(shù)據(jù)訓(xùn)練出能區(qū)分各種物體、聲音或動作的感知模型。針對每輸入的新的圖像、視頻或聲音,終端設(shè)備基于訓(xùn)練好的感知模型,可以計算出相應(yīng)的識別結(jié)果。
[0004]隨著需要識別的類型越來越多,并為了提高識別的準(zhǔn)確率,用來識別感知數(shù)據(jù)的感知模型越來越復(fù)雜,例如感知模型的參數(shù)越來越多。如目前用于圖像識別的卷積神經(jīng)網(wǎng)絡(luò)(Convolut1nal Neural Network,簡稱為“CNN”)模型的參數(shù)已經(jīng)達(dá)到數(shù)千萬,甚至數(shù)億。目前,在許多應(yīng)用中,為了提高用戶體驗,感知模型需要對各種給定場景下的大量的物體、動作、聲音進(jìn)行精準(zhǔn)的識別,這對感知模型的準(zhǔn)確度提出很大的挑戰(zhàn),當(dāng)前技術(shù)中通常采用參數(shù)固定的感知模型完成所有的識別任務(wù),則感知模型的復(fù)雜度將隨著識別需求的細(xì)化而無限增加,從而會對存儲和計算帶來巨大挑戰(zhàn)。
【發(fā)明內(nèi)容】
[0005]本發(fā)明實施例提供一種數(shù)據(jù)處理的方法和設(shè)備,能夠解決設(shè)備的計算能力與感知模型的復(fù)雜度之間的矛盾的問題。
[0006]第一方面提供了一種數(shù)據(jù)處理的方法,該方法包括:
[0007]獲取目標(biāo)感知數(shù)據(jù),該目標(biāo)感知數(shù)據(jù)為下列數(shù)據(jù)中的任一種:圖像數(shù)據(jù)、視頻數(shù)據(jù)和聲音數(shù)據(jù);
[0008]確定該目標(biāo)感知數(shù)據(jù)所屬的目標(biāo)場景;
[0009]確定該目標(biāo)場景對應(yīng)的目標(biāo)感知模型;
[0010]根據(jù)該目標(biāo)感知模型,計算該目標(biāo)感知數(shù)據(jù)的識別結(jié)果。
[0011]結(jié)合第一方面,在第一方面的第一種可能的實現(xiàn)方式中,確定該目標(biāo)感知數(shù)據(jù)所屬的目標(biāo)場景,包括:
[0012]通過對該目標(biāo)感知數(shù)據(jù)進(jìn)行場景分析,確定該目標(biāo)場景。
[0013]結(jié)合第一方面的第一種可能的實現(xiàn)方式,在第一方面的第二種可能的實現(xiàn)方式中,該目標(biāo)感知數(shù)據(jù)為在終端當(dāng)前所處位置生成的數(shù)據(jù);
[0014]其中,該通過對該目標(biāo)感知數(shù)據(jù)進(jìn)行場景分析,確定該目標(biāo)場景,包括:
[0015]結(jié)合該終端當(dāng)前所處位置的定位信息,對該目標(biāo)感知數(shù)據(jù)進(jìn)行場景分析,確定該目標(biāo)場景。
[0016]結(jié)合第一方面,在第一方面的第三種可能的實現(xiàn)方式中,確定該目標(biāo)感知數(shù)據(jù)所屬的目標(biāo)場景,包括:
[0017]向服務(wù)器發(fā)送用于請求該目標(biāo)感知數(shù)據(jù)所屬的場景的第一請求;
[0018]接收該服務(wù)器根據(jù)該第一請求發(fā)送的該目標(biāo)場景。
[0019]結(jié)合第一方面和第一方面的第一種至第三種可能的實現(xiàn)方式中的任一種可能的實現(xiàn)方式,在第一方面的第四種可能的實現(xiàn)方式中,確定該目標(biāo)場景對應(yīng)的目標(biāo)感知模型,包括:
[0020]從預(yù)存的感知模型庫中,確定該目標(biāo)場景對應(yīng)的該目標(biāo)感知模型,該感知模型庫中的每個感知模型分別對應(yīng)一種場景。
[0021]結(jié)合第一方面的第四種可能的實現(xiàn)方式,在第一方面的第五種可能的實現(xiàn)方式中,該方法還包括:
[0022]根據(jù)用戶歷史場景序列,更新該感知模型庫,該更新后的感知模型庫中包括該目標(biāo)場景對應(yīng)的該目標(biāo)感知模型。
[0023]結(jié)合第一方面和第一方面的第一種至第三種可能的實現(xiàn)方式中的任一種可能的實現(xiàn)方式,在第一方面的第六種可能的實現(xiàn)方式中,確定該目標(biāo)場景對應(yīng)的目標(biāo)感知模型,包括:
[0024]當(dāng)確定預(yù)存的感知模型庫中沒有該目標(biāo)場景對應(yīng)的感知模型時,向服務(wù)器發(fā)送用于請求該目標(biāo)場景對應(yīng)的感知模型的第二請求,該感知模型庫中的每個感知模型分別對應(yīng)一種場景;
[0025]接收該服務(wù)器根據(jù)該第二請求發(fā)送的該目標(biāo)場景對應(yīng)的該目標(biāo)感知模型。
[0026]第二方面提供了一種數(shù)據(jù)處理的方法,該方法包括:
[0027]接收終端發(fā)送的用于請求目標(biāo)感知數(shù)據(jù)所屬的場景所對應(yīng)的感知模型的請求消息,該目標(biāo)感知數(shù)據(jù)為下列數(shù)據(jù)中的任一種:圖像數(shù)據(jù)、視頻數(shù)據(jù)和聲音數(shù)據(jù);
[0028]根據(jù)該請求消息,確定該目標(biāo)感知數(shù)據(jù)所屬的目標(biāo)場景;
[0029]從預(yù)存的感知模型庫中,確定該目標(biāo)場景對應(yīng)的目標(biāo)感知模型,該感知模型庫中的每個模型分別對應(yīng)一種場景;
[0030]根據(jù)該請求消息,向該終端發(fā)送該目標(biāo)感知模型,以便于該終端根據(jù)該目標(biāo)感知模型計算該目標(biāo)感知數(shù)據(jù)的識別結(jié)果。
[0031]結(jié)合第二方面,在第二方面的第一種可能的實現(xiàn)方式中,在接收到該請求消息之前,該方法還包括:
[0032]獲取感知數(shù)據(jù)樣本,該感知數(shù)據(jù)樣本至少包括一部分具有場景標(biāo)注信息和物品標(biāo)注信息的感知數(shù)據(jù);
[0033]根據(jù)該感知數(shù)據(jù)樣本,訓(xùn)練不同場景分別對應(yīng)的感知模型;
[0034]將該不同場景分別對應(yīng)的感知模型存儲到該感知模型庫中,該感知模型庫中包括該目標(biāo)感知模型。
[0035]結(jié)合第二方面或第二方面的第一種可能的實現(xiàn)方式,在第二方面的第二種可能的實現(xiàn)方式中,根據(jù)該請求消息,確定該目標(biāo)感知數(shù)據(jù)所屬的目標(biāo)場景,包括:
[0036]通過對該請求消息中包括的該目標(biāo)感知數(shù)據(jù)進(jìn)行場景分析,確定該目標(biāo)感知數(shù)據(jù)所屬的該目標(biāo)場景。
[0037]結(jié)合第二方面的第二種可能的實現(xiàn)方式,在第二方面的第三種可能的實現(xiàn)方式中,目標(biāo)感知數(shù)據(jù)為在終端當(dāng)前所處位置生成的數(shù)據(jù);
[0038]其中,確定該目標(biāo)感知數(shù)據(jù)所屬的該目標(biāo)場景,包括:
[0039]結(jié)合該終端當(dāng)前所處位置的定位信息,對該目標(biāo)感知數(shù)據(jù)進(jìn)行場景分析,確定該目標(biāo)場景。
[0040]結(jié)合第二方面或第二方面的第一種可能的實現(xiàn)方式,在第二方面的第四種可能的實現(xiàn)方式中,根據(jù)該請求消息,確定該目標(biāo)感知數(shù)據(jù)所屬的目標(biāo)場景,包括:
[0041]根據(jù)該請求消息中包括的用于指示該目標(biāo)場景的標(biāo)識,確定該目標(biāo)場景。
[0042]第三方面提供了一種數(shù)據(jù)處理的設(shè)備,該設(shè)備包括:
[0043]獲取模塊,用于獲取目標(biāo)感知數(shù)據(jù),該目標(biāo)感知數(shù)據(jù)為下列數(shù)據(jù)中的任一種:圖像數(shù)據(jù)、視頻數(shù)據(jù)和聲音數(shù)據(jù);
[0044]第一確定模塊,用于確定該獲取模塊獲取的該目標(biāo)感知數(shù)據(jù)所屬的目標(biāo)場景;
[0045]第二確定模塊,用于確定該第一確定模塊確定的該目標(biāo)場景對應(yīng)的目標(biāo)感知模型;
[0046]計算模塊,用于根據(jù)該第二確定模塊確定的該目標(biāo)感知模型,計算該獲取模塊獲取的該目標(biāo)感知數(shù)據(jù)的識別結(jié)果。
[0047]結(jié)合第三方面,在第三方面的第一種可能的實現(xiàn)方式中,該第一確定模塊具體用于,通過對該目標(biāo)感知數(shù)據(jù)進(jìn)行場景分析,確定該目標(biāo)場景。
[0048]結(jié)合第三方面的第一種可能的實現(xiàn)方式,在第三方面的第二種可能的實現(xiàn)方式中,該目標(biāo)感知數(shù)據(jù)為在終端當(dāng)前所處位置生成的數(shù)據(jù);
[0049]其中,該第一確定模塊具體用于,結(jié)合該終端當(dāng)前所處位置的定位信息,對該目標(biāo)感知數(shù)據(jù)進(jìn)行場景分析,確定該目標(biāo)場景。
[0050]結(jié)合第三方面,在第三方面的第三種可能的實現(xiàn)方式中,該第一確定模塊包括:
[0051]第一發(fā)送單元,用于向服務(wù)器發(fā)送用于請求該目標(biāo)感知數(shù)據(jù)所屬的場景的第一請求;
[0052]第一接收單元,用于接收該服務(wù)器根據(jù)該第一請求發(fā)送的該目標(biāo)場景。
[0053]結(jié)合第三方面和第三方面的第一種至第三種可能的實現(xiàn)方式中的任一種可能的實現(xiàn)方式,在第三方面的第四種可能的實現(xiàn)方式中,該第二確定模塊具體用于,從預(yù)存的感知模型庫中,確定該目標(biāo)場景對應(yīng)的該目標(biāo)感知模型,該感知模型庫中的每個感知模型分別對應(yīng)一種場景。
[0054]結(jié)合第三方面的第四種可能的實現(xiàn)方式,在第三方面的第五種可能的實現(xiàn)方式中,該設(shè)備還包括:
[0055]更新模塊,用于在該獲取模塊獲取目標(biāo)感知數(shù)據(jù)之前,根據(jù)用戶歷史場景序列,更新該感知模型庫,該更新后的感知模型庫中包括該目標(biāo)場景對應(yīng)的該目標(biāo)感知模型。
[0056]結(jié)合第三方面和第三方面的第一種至第三種可能的實現(xiàn)方式中的任一種可能的實現(xiàn)方式,在第三方面的第六種可能的實現(xiàn)方式中,該第二確定模塊包括:
[0057]第二發(fā)送單元,用于當(dāng)確定預(yù)存的感知模型庫中沒有該目標(biāo)場景對應(yīng)的感知模型時,向服務(wù)器發(fā)送用于請求該目標(biāo)場景對應(yīng)的感知模型的第二請求,該感知模型庫中的每個感知模型分別對應(yīng)一種場景;
[0058]第二接收單元,用于接收該服務(wù)器根據(jù)該第二請求發(fā)送的該目標(biāo)場景對應(yīng)的該目標(biāo)感知模型。
[0059]第四方面提供了一種數(shù)據(jù)處理的設(shè)備,該設(shè)備包括:
[0060]接收模塊,用于接收終端發(fā)送的用于請求目標(biāo)感知數(shù)據(jù)所屬的場景所對應(yīng)的感知模型的請求消息,該目標(biāo)感知數(shù)據(jù)為下列數(shù)據(jù)中的任一種:圖像數(shù)據(jù)、視頻數(shù)據(jù)和聲音數(shù)據(jù);
[0061]第一確定模塊,用于根據(jù)該接收模塊接收的該請求消息,確定該目標(biāo)感知數(shù)據(jù)所屬的目標(biāo)場景;
[0062]第二確定模塊,用于從預(yù)存的感知模型庫中,確定該第一確定模塊確定的該目標(biāo)場景對應(yīng)的目標(biāo)感知模型,該感知模型庫中的每個模型分別對應(yīng)一種場景;
[0063]發(fā)送模塊,用于根據(jù)該接收模塊接收的該請求消息,向該終端發(fā)送該第二確定模塊確定的該目標(biāo)感知模型,以便于該終端根據(jù)該目標(biāo)感知模型計算該目標(biāo)感知數(shù)據(jù)的識別結(jié)果。
[0064]結(jié)合第四方面,在第四方面的第一種可能的實現(xiàn)方式中,該設(shè)備還包括:
[0065]獲取模塊,用于在該接收模塊接收到該請求消息之前,獲取感知數(shù)據(jù)樣本,該感知數(shù)據(jù)樣本至少包括一部分具有場景標(biāo)注信息和物品標(biāo)注信息的感知數(shù)據(jù);
[0066]訓(xùn)練模塊,用于根據(jù)該感知數(shù)據(jù)樣本,訓(xùn)練不同場景分別對應(yīng)的感知模型;
[0067]存儲模塊,用于將該訓(xùn)練模塊訓(xùn)練得到的該不同場景分別對應(yīng)的感知模型存儲到該感知模型庫中,該感知模型庫中包括該目標(biāo)感知模型。
[0068]結(jié)合第四方面或第四方面的第一種可能的實現(xiàn)方式,在第四方面的第二種可能的實現(xiàn)方式中,該第一確定模塊具體用于,通過對該請求消息中包括的該目標(biāo)感知數(shù)據(jù)進(jìn)行場景分析,確定該目標(biāo)感知數(shù)據(jù)所屬的該目標(biāo)場景。
[0069]結(jié)合第四方面的第二種可能的實現(xiàn)方式,在第四方面的第三種可能的實現(xiàn)方式中,該目標(biāo)感知數(shù)據(jù)為在終端當(dāng)前所處位置生成的數(shù)據(jù);
[0070]其中,該第一確定模塊具體用于,結(jié)合該終端當(dāng)前所處位置的定位信息,對該目標(biāo)感知數(shù)據(jù)進(jìn)行場景分析,確定該目標(biāo)場景。
[0071]結(jié)合第四方面或第四方面的第一種可能的實現(xiàn)方式,在第四方面的第四種可能的實現(xiàn)方式中,該第一確定模塊具體用于,根據(jù)該請求消息中包括的用于指示該目標(biāo)場景的標(biāo)識,確定該目標(biāo)場景。
[0072]基于上述技術(shù)方案,本發(fā)明實施例的數(shù)據(jù)處理的方法和設(shè)備中,通過確定感知數(shù)據(jù)所屬的場景,利用該場景所對應(yīng)的感知模型計算獲得該感知數(shù)據(jù)的識別結(jié)果,相比現(xiàn)有技術(shù),能夠降低計算復(fù)雜度,從而能夠提高數(shù)據(jù)處理的效率。
【附圖說明】
[0073]為了更清楚地說明本發(fā)明實施例的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0074]圖1示出了本發(fā)明實施例的數(shù)據(jù)處理的方法的示意性流程圖。
[0075]圖2示出了本發(fā)明另一實施例的數(shù)據(jù)處理的方法的示意性流程圖。
[0076]圖3示出了本發(fā)明另一實施例提供的訓(xùn)練感知模型的示意性流程圖。
[0077]圖4示出了本發(fā)明實施例的數(shù)據(jù)處理的設(shè)備的示意性框圖。
[0078]圖5示出了本發(fā)明實施例的數(shù)據(jù)處理的設(shè)備的另一示意性框圖。
[0079]圖6示出了本發(fā)明另一實施例的數(shù)據(jù)處理的設(shè)備的示意性框圖。
[0080]圖7示出了本發(fā)明另一實施例的數(shù)據(jù)處理的設(shè)備的另一示意性框圖。
[0081]圖8示出了本發(fā)明實施例提供的數(shù)據(jù)處理的設(shè)備的示意性框圖。
[0082]圖9示出了本發(fā)明另一實施例提供的數(shù)據(jù)處理的設(shè)備的示意性框圖。
【具體實施方式】
[0083]下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進(jìn)行清楚地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護(hù)的范圍。
[0084]應(yīng)理解,本發(fā)明實施例的技術(shù)方案可以應(yīng)用于各種通信系統(tǒng),例如:通用移動通信系統(tǒng)(Universal Mobile Telecommunicat1n System,簡稱為 “UMTS”)、全球移動通訊(Global System of Mobile communicat1n,簡稱為 “GSM”)系