數(shù)字大屏和AI數(shù)字人結(jié)合軟件系統(tǒng)定制開(kāi)發(fā)
大家好,我是成都小火科技的項(xiàng)目經(jīng)理,今天是2025年11月12日,星期三。上個(gè)月我?guī)е鴪F(tuán)隊(duì)幫某政務(wù)單位做數(shù)據(jù)匯報(bào)系統(tǒng)升級(jí)的時(shí)候,存在客戶突然提出一個(gè)新想法的情況,他們說(shuō)現(xiàn)在的數(shù)字大屏雖然數(shù)據(jù)展示得挺全,但總覺(jué)得少了點(diǎn)“人氣”,想讓屏幕上的數(shù)據(jù)“活”起來(lái),找個(gè)AI數(shù)字人當(dāng)專屬講解員?,F(xiàn)在AI數(shù)字人應(yīng)用得越來(lái)越廣泛,和數(shù)字大屏結(jié)合起來(lái),確實(shí)是個(gè)頗為新穎又實(shí)用的方向,也讓我立刻想到了我們之前開(kāi)發(fā)數(shù)據(jù)大屏監(jiān)測(cè)系統(tǒng)和AI智慧教育系統(tǒng)時(shí)積累的那些技術(shù)經(jīng)驗(yàn),于是我當(dāng)場(chǎng)就跟客戶表示這個(gè)項(xiàng)目我們能接,接下來(lái)這大半個(gè)月的開(kāi)發(fā)過(guò)程,真的有太多細(xì)節(jié)值得好好說(shuō)說(shuō)。
客戶第一次來(lái)我們公司詳談的時(shí)候,一進(jìn)門就頗為急切地問(wèn)了我好幾個(gè)核心問(wèn)題,第一個(gè)是我們公司到底有多少技術(shù)人員,能不能確保這個(gè)項(xiàng)目的開(kāi)發(fā)質(zhì)量;第二個(gè)是能不能提供一份詳細(xì)的開(kāi)發(fā)進(jìn)度表,他們好隨時(shí)跟進(jìn)項(xiàng)目情況;第三個(gè)則是上線后如果出現(xiàn)bug,我們到底負(fù)不負(fù)責(zé)維修,維護(hù)費(fèi)又該怎么收。這些問(wèn)題其實(shí)都是很多客戶在合作前常常會(huì)問(wèn)到的狀況,我早就習(xí)慣了用最實(shí)在的方式去回應(yīng)。我當(dāng)時(shí)就打開(kāi)我們公司的官網(wǎng),指著上面的資質(zhì)信息跟他們介紹,我所在的成都小火科技是2013年成立的,現(xiàn)在研發(fā)人員的占比超過(guò)80%,其中30%以上都來(lái)自阿里、字節(jié)這些互聯(lián)網(wǎng)大廠,光AI算法工程師就有足足12個(gè),技術(shù)實(shí)力絕對(duì)有保障。至于開(kāi)發(fā)進(jìn)度表,我當(dāng)場(chǎng)就讓產(chǎn)品經(jīng)理根據(jù)初步需求,整理了一份包含需求拆解、模型訓(xùn)練、大屏適配、聯(lián)調(diào)測(cè)試四個(gè)階段的進(jìn)度表,每個(gè)階段的開(kāi)始時(shí)間、結(jié)束時(shí)間和驗(yàn)收標(biāo)準(zhǔn)都寫(xiě)得明明白白,還承諾每個(gè)階段結(jié)束后都會(huì)主動(dòng)跟他們對(duì)接驗(yàn)收。關(guān)于bug修復(fù)和維護(hù)費(fèi)的問(wèn)題,我也說(shuō)得很清楚,上線后6個(gè)月內(nèi)出現(xiàn)的bug我們都免費(fèi)負(fù)責(zé)修復(fù),維護(hù)費(fèi)是按年收取的,費(fèi)用大概是項(xiàng)目總額的15%,這樣的答復(fù)讓客戶的顧慮總算是打消了不少。
正式進(jìn)入開(kāi)發(fā)階段后,我們團(tuán)隊(duì)做的第一件事就是把平臺(tái)的核心功能拆解開(kāi),存在我們將整個(gè)平臺(tái)分成AI數(shù)字人、數(shù)字大屏、數(shù)據(jù)聯(lián)動(dòng)三個(gè)核心模塊的情況,每個(gè)模塊都安排了專門的技術(shù)小組負(fù)責(zé),這樣分工明確,效率也能高不少。AI數(shù)字人這個(gè)模塊是整個(gè)項(xiàng)目的重點(diǎn),我們采用了超寫(xiě)實(shí)的數(shù)字人建模技術(shù),先找了專業(yè)的講解員來(lái)采集肢體語(yǔ)言和語(yǔ)音樣本,再通過(guò)動(dòng)作捕捉設(shè)備把這些數(shù)據(jù)導(dǎo)入系統(tǒng),配合NLP自然語(yǔ)言處理算法,讓數(shù)字人不僅能說(shuō)話,還能準(zhǔn)確理解用戶的問(wèn)題并給出回應(yīng),這個(gè)技術(shù)邏輯其實(shí)和我們之前開(kāi)發(fā)AI智慧教育系統(tǒng)時(shí)用到的人機(jī)交互邏輯頗為相似。數(shù)字大屏模塊則是延續(xù)了我們開(kāi)發(fā)數(shù)據(jù)大屏監(jiān)測(cè)系統(tǒng)的成熟經(jīng)驗(yàn),支持多數(shù)據(jù)源接入,不管是政務(wù)系統(tǒng)里的統(tǒng)計(jì)數(shù)據(jù),還是物聯(lián)網(wǎng)設(shè)備實(shí)時(shí)上傳的數(shù)據(jù),都能順利導(dǎo)入,而且數(shù)據(jù)更新的延遲能控制在1秒以內(nèi),確保展示的數(shù)據(jù)都是最新的。最關(guān)鍵的還是數(shù)據(jù)聯(lián)動(dòng)模塊,我們用java開(kāi)發(fā)了專門的數(shù)據(jù)解析接口,讓AI數(shù)字人能實(shí)時(shí)抓取數(shù)字大屏上的數(shù)據(jù),并且根據(jù)數(shù)據(jù)變化自動(dòng)生成解讀文案,比如當(dāng)大屏上的GDP數(shù)據(jù)超過(guò)預(yù)設(shè)閾值時(shí),數(shù)字人就會(huì)自動(dòng)重點(diǎn)講解增長(zhǎng)的原因和具體的構(gòu)成,這樣一來(lái),數(shù)據(jù)和講解就真正實(shí)現(xiàn)了無(wú)縫銜接。
開(kāi)發(fā)過(guò)程中,存在我們遇到不少技術(shù)難題的狀況,其中最讓人頭疼的就是數(shù)字人動(dòng)作與語(yǔ)音不同步的問(wèn)題。在初期的測(cè)試階段,數(shù)字人的口型和語(yǔ)音總是存在0.3秒左右的延遲,看起來(lái)特別僵硬,一點(diǎn)都不自然,我當(dāng)時(shí)心里也頗為著急,趕緊組織技術(shù)團(tuán)隊(duì)開(kāi)了個(gè)緊急會(huì)議。會(huì)上有個(gè)技術(shù)骨干提出,可以采用預(yù)加載機(jī)制,把一些常用的解讀話術(shù)對(duì)應(yīng)的口型動(dòng)作提前緩存到系統(tǒng)里,同時(shí)優(yōu)化語(yǔ)音合成算法,提升語(yǔ)音生成的速度。存在我們按照這個(gè)思路反復(fù)調(diào)試了好幾天的情況,每天都要進(jìn)行上百次的測(cè)試和調(diào)整,最終總算是把延遲控制在了0.1秒以內(nèi),從視覺(jué)上完全看不出破綻,這個(gè)結(jié)果讓整個(gè)團(tuán)隊(duì)都松了一口氣。還有個(gè)小插曲,項(xiàng)目進(jìn)行到第8周的時(shí)候,客戶突然提出想讓數(shù)字人支持多語(yǔ)種講解,說(shuō)有時(shí)候會(huì)有外國(guó)訪客來(lái)參觀,需要英文和日文的講解服務(wù)。我當(dāng)時(shí)雖然擔(dān)心會(huì)影響項(xiàng)目進(jìn)度,但想到這確實(shí)是個(gè)實(shí)用的需求,還是立刻安排技術(shù)團(tuán)隊(duì)著手開(kāi)發(fā),沒(méi)想到他們僅用5天就完成了多語(yǔ)言語(yǔ)音包的接入和調(diào)試,讓數(shù)字人順利實(shí)現(xiàn)了中文、英文、日文的實(shí)時(shí)切換,客戶得知后也頗為驚喜,一個(gè)勁地夸我們團(tuán)隊(duì)反應(yīng)快。
我一直覺(jué)得,一個(gè)項(xiàng)目能順利推進(jìn),除了技術(shù)實(shí)力,規(guī)范的開(kāi)發(fā)流程也頗為重要。我們公司有著嚴(yán)格的軟件開(kāi)發(fā)流程,從軟件銷售對(duì)接需求開(kāi)始,到產(chǎn)品經(jīng)理梳理需求文檔,再到技術(shù)主管制定技術(shù)方案,UI設(shè)計(jì)、前端開(kāi)發(fā)、后端開(kāi)發(fā)、前后端聯(lián)調(diào)、測(cè)試服部署、測(cè)試人員驗(yàn)收、正式上線,最后到后期運(yùn)維,每個(gè)環(huán)節(jié)都有專人負(fù)責(zé),專人專崗,確保每一步都不會(huì)出問(wèn)題。這次項(xiàng)目我們選用了自主服務(wù)器,因?yàn)榭蛻羰钦?wù)單位,數(shù)據(jù)的敏感性比較高,自主服務(wù)器能更好地保障數(shù)據(jù)安全,我們還特意配備了異地備份系統(tǒng),防止出現(xiàn)數(shù)據(jù)丟失的狀況。另外,考慮到客戶團(tuán)隊(duì)可能對(duì)平臺(tái)的操作不太熟悉,在項(xiàng)目接近尾聲的時(shí)候,我特意安排了專門的培訓(xùn),親自帶著他們熟悉后臺(tái)的操作,從數(shù)字人的語(yǔ)音調(diào)整、大屏數(shù)據(jù)的導(dǎo)入,到常見(jiàn)問(wèn)題的排查,每一個(gè)步驟都講得明明白白,還制作了圖文并茂的操作手冊(cè),方便他們后續(xù)查閱。
現(xiàn)在這個(gè)平臺(tái)已經(jīng)順利驗(yàn)收交付了,前幾天客戶還特意給我發(fā)消息,說(shuō)在一次政務(wù)公開(kāi)活動(dòng)中,AI數(shù)字人全程獨(dú)立完成了20分鐘的講解,現(xiàn)場(chǎng)的反響特別熱烈,不少訪客都夸這個(gè)形式新穎又實(shí)用?;剡^(guò)頭來(lái)復(fù)盤(pán)整個(gè)項(xiàng)目,我總結(jié)出了兩個(gè)頗為重要的經(jīng)驗(yàn),第一個(gè)是AI數(shù)字人的模型訓(xùn)練一定要用足夠多的真實(shí)數(shù)據(jù),前期我們光是采集講解員的動(dòng)作和語(yǔ)音樣本就花了整整一周,這些扎實(shí)的基礎(chǔ)工作才讓后續(xù)的開(kāi)發(fā)少走了很多彎路;第二個(gè)是數(shù)字大屏的適配要考慮到不同的屏幕尺寸,我們這次特意做了適配優(yōu)化,從55寸的小屏幕到210寸的超大屏幕都能正常使用,大大提升了平臺(tái)的通用性。我所在的成都小火科技作為高新技術(shù)企業(yè),還擁有ISO/IEC 27001:2002認(rèn)證和ISO900認(rèn)證,這些資質(zhì)也讓我們?cè)陂_(kāi)發(fā)這類涉及敏感數(shù)據(jù)的項(xiàng)目時(shí)更有底氣。未來(lái),我們計(jì)劃把這個(gè)平臺(tái)的技術(shù)應(yīng)用到更多場(chǎng)景,比如企業(yè)展廳、博物館這些地方,讓AI數(shù)字人和數(shù)字大屏的結(jié)合,成為信息傳播的新載體。在現(xiàn)在這個(gè)數(shù)據(jù)時(shí)代,讓冰冷的數(shù)據(jù)通過(guò)更生動(dòng)的方式“說(shuō)話”,才能真正發(fā)揮出數(shù)據(jù)所蘊(yùn)含的價(jià)值,這也是我作為一名軟件項(xiàng)目經(jīng)理,一直以來(lái)所追求的目標(biāo)。
文章來(lái)源網(wǎng)址:http://www.zizhu8.cn/archives/xitongkaifa01/2400,轉(zhuǎn)載請(qǐng)注明出處!
精選案例
推薦文章
Core competence
高質(zhì)量軟件開(kāi)發(fā)公司-成都小火科技
多一套方案,多一份選擇
聯(lián)系小火科技項(xiàng)目經(jīng)理,及時(shí)獲取專屬《項(xiàng)目方案》及開(kāi)發(fā)報(bào)價(jià)
咨詢相關(guān)問(wèn)題或預(yù)約面談,可以通過(guò)以下方式與我們聯(lián)系
業(yè)務(wù)熱線 19113551853
19113551853