圖像拖拽編輯方法及系統(tǒng)

文檔序號：40404442發(fā)布日期：2024-12-20 12:28閱讀：5來源：國知局

本公開屬于圖像處理，更具體地說，是涉及一種圖像拖拽編輯方法及系統(tǒng)。

背景技術：

1、傳統(tǒng)的圖像編輯條件包括文本條件和圖像條件，但這些條件在表示一些編輯屬性（如形狀和位置）方面顯得不足。為了解決這個問題，最近的研究提出了一項新任務，即圖像拖拽編輯。在拖拽編輯中，用戶輸入拖拽點（起始點和目標點）作為編輯條件，通過將物體移動到目標位置，實現(xiàn)了對于形狀、位置等屬性的精準控制。

2、目前，拖拽編輯的編輯結果可能會出現(xiàn)與用戶期望結果相差較大的情況，如圖1所示，圖1中的拖拽點條件的起始點在馬的頭部，目標點在右上方，用戶期望的編輯結果是讓馬抬頭，但是實際的編輯結果是讓馬脖子變長。因此，需要對拖拽編輯的方法做出進一步改進。

技術實現(xiàn)思路

1、本公開的目的在于提供一種圖像拖拽編輯方法及系統(tǒng)，以得到符合用戶預期的拖拽編輯結果。

2、本公開實施例的第一方面，提供了一種圖像拖拽編輯方法，包括：

3、基于第一圖像和第一圖像的拖拽點信息進行意圖推理，得到n個語義意圖；所述第一圖像為拖拽編輯前的原始圖像；

4、基于n個語義意圖分別對第一圖像進行編輯，得到n個第二圖像；所述n個第二圖像用于指示用戶從所述n個第二圖像中選取目標圖像。

5、本公開實施例的第二方面，提供了一種圖像拖拽編輯裝置，包括：

6、意圖推理模塊，用于基于用戶針對第一圖像輸入的拖拽點進行意圖推理，得到n個語義意圖；所述第一圖像為拖拽編輯前的原始圖像；

7、協(xié)同引導模塊，用于基于n個語義意圖分別對第一圖像進行編輯，得到n個第二圖像；所述n個第二圖像用于指示用戶從所述n個第二圖像中選取目標圖像。

8、本公開實施例的第三方面，提供了一種圖像拖拽編輯系統(tǒng)，包括存儲器、處理器以及存儲在所述存儲器中并在所述處理器上運行的計算機程序，所述處理器執(zhí)行所述計算機程序時實現(xiàn)上述的圖像拖拽編輯方法的步驟。

9、本公開實施例的第四方面，提供了一種計算機可讀存儲介質，所述計算機可讀存儲介質存儲有計算機程序，所述計算機程序被處理器執(zhí)行時實現(xiàn)上述的圖像拖拽編輯方法的步驟。

10、本公開實施例提供的圖像拖拽編輯方法及系統(tǒng)的有益效果在于：

11、本公開實施例考慮到同一個拖拽點條件可以表示多種語義意圖，而現(xiàn)有方法忽略了這種語義多樣性，僅按照一種語義進行拖拽編輯，導致拖拽編輯后的圖像與用戶期望的結果不符。因此，本公開實施例首先基于第一圖像和第一圖像的拖拽點信息進行意圖推理，得到幾種可能的意圖。通過明確地引入語義，增強了語義感知，同時豐富了編輯結果的多樣性，用戶可以從中選擇自己期望的目標圖像，也即實現(xiàn)了拖拽編輯結果與用戶期望的結果一致。

技術特征：

1.一種圖像拖拽編輯方法，其特征在于，包括：

2.如權利要求1所述的圖像拖拽編輯方法，其特征在于，所述語義意圖包括起始提示和目標提示，所述起始提示用于指示第一圖像的描述信息，所述目標指示用于指示第二圖像的描述信息；

3.如權利要求2所述的圖像拖拽編輯方法，其特征在于，所述去噪處理的過程包括多個依次執(zhí)行的去噪步驟，所述圖像拖拽編輯方法還包括：

4.如權利要求3所述的圖像拖拽編輯方法，其特征在于，所述基于第一概率和第二概率的相對大小計算圖像質量引導函數(shù)，包括：

5.如權利要求2所述的圖像拖拽編輯方法，其特征在于，所述去噪處理的過程包括多個依次執(zhí)行的去噪步驟，所述加噪處理的過程包括多個依次執(zhí)行的加噪步驟，所述圖像拖拽編輯方法還包括：

6.如權利要求5所述的圖像拖拽編輯方法，其特征在于，所述基于所述第一特征向量、所述第二特征向量、起始拖拽位置和目標拖拽位置計算拖拽區(qū)域的能量函數(shù)，包括：

7.如權利要求2所述的圖像拖拽編輯方法，其特征在于，所述去噪處理的過程包括多個依次執(zhí)行的去噪步驟，所述加噪處理的過程包括多個依次執(zhí)行的加噪步驟，所述圖像拖拽編輯方法還包括：

8.一種圖像拖拽編輯裝置，其特征在于，包括：

9.一種圖像拖拽編輯系統(tǒng)，包括存儲器、處理器以及存儲在所述存儲器中并在所述處理器上運行的計算機程序，其特征在于，所述處理器執(zhí)行所述計算機程序時實現(xiàn)如權利要求1至7任一項所述方法的步驟。

10.一種計算機可讀存儲介質，所述計算機可讀存儲介質存儲有計算機程序，其特征在于，所述計算機程序被處理器執(zhí)行時實現(xiàn)如權利要求1至7任一項所述方法的步驟。

技術總結
本公開提供了一種圖像拖拽編輯方法及系統(tǒng)，屬于圖像處理技術領域，該方法包括：基于第一圖像和第一圖像的拖拽點信息進行意圖推理，得到N個語義意圖；所述第一圖像為拖拽編輯前的原始圖像；基于N個語義意圖分別對第一圖像進行編輯，得到N個第二圖像；所述N個第二圖像用于指示用戶從所述N個第二圖像中選取目標圖像。本公開提供的圖像拖拽編輯方法及系統(tǒng)能夠得到符合用戶預期的拖拽編輯結果。

技術研發(fā)人員：李佩佩,崔興,何召鋒,滕乾瑞
受保護的技術使用者：北京郵電大學
技術研發(fā)日：
技術公布日：2024/12/19

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：李佩佩,崔興,何召鋒,滕乾瑞
技術所有人：北京郵電大學
我是此專利的發(fā)明人

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構動力學與控制
3、袁老師：1.計算機視覺 2.無線網絡及物聯(lián)網
4、王老師：1.計算機網絡安全 2.計算機仿真技術
5、王老師：1.網絡安全；物聯(lián)網安全、大數(shù)據安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關技術

網友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

圖像拖拽編輯方法及系統(tǒng)