在這里了解千眼狼最新動(dòng)態(tài)
1實(shí)驗(yàn)背景
千眼狼研發(fā)工程師們,自主研發(fā)局部DIC-GPU算法,針對自研的DIC軟硬件生態(tài)深度優(yōu)化。研發(fā)人員通過開展幾組經(jīng)典實(shí)驗(yàn),并與開源GPU算法進(jìn)行橫向?qū)Ρ取?/p> 2技術(shù)原理 自研局部DIC-GPU算法核心是將圖像數(shù)據(jù)、子區(qū)網(wǎng)格位置和寬高信息預(yù)加載至GPU顯存,利用數(shù)千核心并行處理所有子區(qū)的互相關(guān)計(jì)算。工程師們優(yōu)化了線程調(diào)度,減少內(nèi)存訪問冗余,并自研子區(qū)網(wǎng)格動(dòng)態(tài)分配策略,以最大化調(diào)用GPU算力資源。
3實(shí)驗(yàn)驗(yàn)證
為驗(yàn)證實(shí)際效果,千眼狼工程師設(shè)計(jì)了六組實(shí)驗(yàn),實(shí)驗(yàn)基于同一測試環(huán)境GPU 4070開展:
場景1 仿真旋轉(zhuǎn)
數(shù)據(jù)規(guī)模:有效子區(qū)個(gè)數(shù)0.4W
計(jì)算結(jié)果:左 開源算法耗時(shí)160ms,右 自研算法耗時(shí)僅54ms

場景2 仿真輻射
數(shù)據(jù)規(guī)模:有效子區(qū)個(gè)數(shù)1.7W
計(jì)算結(jié)果:左 開源算法耗時(shí)696ms,右 自研算法耗時(shí)僅85ms

場景3 圓桿拉伸
數(shù)據(jù)規(guī)模:有效子區(qū)個(gè)數(shù)0.3W
計(jì)算結(jié)果:左 開源算法耗時(shí)826ms,右 自研算法耗時(shí)僅64ms

場景4 三點(diǎn)彎
數(shù)據(jù)規(guī)模:有效子區(qū)個(gè)數(shù)0.7W
計(jì)算結(jié)果:左 開源算法耗時(shí)2011ms,右 自研算法耗時(shí)僅109ms

場景5 孔洞拉伸
數(shù)據(jù)規(guī)模:有效子區(qū)個(gè)數(shù)3.2W
計(jì)算結(jié)果:左 開源算法耗時(shí)2755ms,右 自研算法耗時(shí)僅148ms

場景6 拉伸裂紋
數(shù)據(jù)規(guī)模:有效子區(qū)個(gè)數(shù)6.6W
計(jì)算結(jié)果:左 開源算法耗時(shí)3855ms,右 自研算法耗時(shí)僅217ms

六大實(shí)驗(yàn)場景耗時(shí)對比
千眼狼自研GPU加速算法較開源GPU 提速3–18倍,且子區(qū)規(guī)模越大優(yōu)勢越顯著。如圓桿拉伸0.3W子區(qū)提速3倍,6.6W子區(qū)拉伸裂紋場景提速18倍。

六大實(shí)驗(yàn)場景精度對比
千眼狼工程師們使用帶有位移真值的仿真素材做精度對比,素材位移真值為振幅衰減的正弦函數(shù),繪制自研GPU計(jì)算結(jié)果、開源GPU計(jì)算結(jié)果和位移真值曲線如下:

將兩組計(jì)算結(jié)果與真值的平均絕對誤差和均方根誤差如下:

4實(shí)驗(yàn)結(jié)論
通過上述實(shí)驗(yàn)對比,千眼狼自主研發(fā)的局部DIC-GPU算法與開源GPU算法在精度一致的前提下,在效率、適用性、穩(wěn)定性上有較大提升。
1)效率:實(shí)現(xiàn)了較開源算法同計(jì)算場景下的3~18倍的提升。
2)適用性:涵蓋從仿真到實(shí)拍不同場景,可高效處理萬級以上子區(qū)。
3)穩(wěn)定性:計(jì)算結(jié)果與開源方案誤差≤0.03pixel,滿足科研級精度需求。
5實(shí)驗(yàn)展望
電話:400-859-1866
郵箱:sales@agiledevice.com
地址:安徽省合肥市包河富煌新視覺大廈
微信公眾號
官方抖音