本公開屬于圖像處理,更具體地說,是涉及一種圖像拖拽編輯方法及系統(tǒng)。
背景技術:
1、傳統(tǒng)的圖像編輯條件包括文本條件和圖像條件,但這些條件在表示一些編輯屬性(如形狀和位置)方面顯得不足。為了解決這個問題,最近的研究提出了一項新任務,即圖像拖拽編輯。在拖拽編輯中,用戶輸入拖拽點(起始點和目標點)作為編輯條件,通過將物體移動到目標位置,實現(xiàn)了對于形狀、位置等屬性的精準控制。
2、目前,拖拽編輯的編輯結果可能會出現(xiàn)與用戶期望結果相差較大的情況,如圖1所示,圖1中的拖拽點條件的起始點在馬的頭部,目標點在右上方,用戶期望的編輯結果是讓馬抬頭,但是實際的編輯結果是讓馬脖子變長。因此,需要對拖拽編輯的方法做出進一步改進。
技術實現(xiàn)思路
1、本公開的目的在于提供一種圖像拖拽編輯方法及系統(tǒng),以得到符合用戶預期的拖拽編輯結果。
2、本公開實施例的第一方面,提供了一種圖像拖拽編輯方法,包括:
3、基于第一圖像和第一圖像的拖拽點信息進行意圖推理,得到n個語義意圖;所述第一圖像為拖拽編輯前的原始圖像;
4、基于n個語義意圖分別對第一圖像進行編輯,得到n個第二圖像;所述n個第二圖像用于指示用戶從所述n個第二圖像中選取目標圖像。
5、本公開實施例的第二方面,提供了一種圖像拖拽編輯裝置,包括:
6、意圖推理模塊,用于基于用戶針對第一圖像輸入的拖拽點進行意圖推理,得到n個語義意圖;所述第一圖像為拖拽編輯前的原始圖像;
7、協(xié)同引導模塊,用于基于n個語義意圖分別對第一圖像進行編輯,得到n個第二圖像;所述n個第二圖像用于指示用戶從所述n個第二圖像中選取目標圖像。
8、本公開實施例的第三方面,提供了一種圖像拖拽編輯系統(tǒng),包括存儲器、處理器以及存儲在所述存儲器中并在所述處理器上運行的計算機程序,所述處理器執(zhí)行所述計算機程序時實現(xiàn)上述的圖像拖拽編輯方法的步驟。
9、本公開實施例的第四方面,提供了一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)上述的圖像拖拽編輯方法的步驟。
10、本公開實施例提供的圖像拖拽編輯方法及系統(tǒng)的有益效果在于:
11、本公開實施例考慮到同一個拖拽點條件可以表示多種語義意圖,而現(xiàn)有方法忽略了這種語義多樣性,僅按照一種語義進行拖拽編輯,導致拖拽編輯后的圖像與用戶期望的結果不符。因此,本公開實施例首先基于第一圖像和第一圖像的拖拽點信息進行意圖推理,得到幾種可能的意圖。通過明確地引入語義,增強了語義感知,同時豐富了編輯結果的多樣性,用戶可以從中選擇自己期望的目標圖像,也即實現(xiàn)了拖拽編輯結果與用戶期望的結果一致。
1.一種圖像拖拽編輯方法,其特征在于,包括:
2.如權利要求1所述的圖像拖拽編輯方法,其特征在于,所述語義意圖包括起始提示和目標提示,所述起始提示用于指示第一圖像的描述信息,所述目標指示用于指示第二圖像的描述信息;
3.如權利要求2所述的圖像拖拽編輯方法,其特征在于,所述去噪處理的過程包括多個依次執(zhí)行的去噪步驟,所述圖像拖拽編輯方法還包括:
4.如權利要求3所述的圖像拖拽編輯方法,其特征在于,所述基于第一概率和第二概率的相對大小計算圖像質量引導函數(shù),包括:
5.如權利要求2所述的圖像拖拽編輯方法,其特征在于,所述去噪處理的過程包括多個依次執(zhí)行的去噪步驟,所述加噪處理的過程包括多個依次執(zhí)行的加噪步驟,所述圖像拖拽編輯方法還包括:
6.如權利要求5所述的圖像拖拽編輯方法,其特征在于,所述基于所述第一特征向量、所述第二特征向量、起始拖拽位置和目標拖拽位置計算拖拽區(qū)域的能量函數(shù),包括:
7.如權利要求2所述的圖像拖拽編輯方法,其特征在于,所述去噪處理的過程包括多個依次執(zhí)行的去噪步驟,所述加噪處理的過程包括多個依次執(zhí)行的加噪步驟,所述圖像拖拽編輯方法還包括:
8.一種圖像拖拽編輯裝置,其特征在于,包括:
9.一種圖像拖拽編輯系統(tǒng),包括存儲器、處理器以及存儲在所述存儲器中并在所述處理器上運行的計算機程序,其特征在于,所述處理器執(zhí)行所述計算機程序時實現(xiàn)如權利要求1至7任一項所述方法的步驟。
10.一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,其特征在于,所述計算機程序被處理器執(zhí)行時實現(xiàn)如權利要求1至7任一項所述方法的步驟。