
案例|智慧金融:借助AI訓練數據打造全新數字員工
發布時間 : 2023-03-31 閱讀量 : 1082
彭博近日發布了金融領域大語言模型:BloombergGPT,500 億參數語言模型(*)。數字化、智能化轉型正在各行各業全面鋪開,人工智能等技術加速向金融業滲透,保險從業機構保持技術的敏感度,持續提升創新能力,不斷挖掘增量市場,以應對科技發展帶來的挑戰和機遇。作為領先的AI數據解決方案提供商,深耕對話式人工智能領域,期待能在未來持續為行業客戶提供數據側支持,從數據科學的專業視角賦能客戶的數智化轉型。
客戶概況
客戶公司是國內重要保險從業機構。隨著數字化轉型的加速,客戶對于智能化客服的需求越來越迫切,希望優惠活動大廳通過人工智能技術和虛擬數字人等科技創新方式,來完善和升級其運營、營銷和客服功能,提升用戶體驗。優惠活動大廳通過引入AI數字員工,客戶希望在降低運營成本的同時增加效率,打造出一個與眾不同的企業形象,這不僅可以吸引更多的新客戶,還可以提升企業的品牌價值。
需求與挑戰
數字員工是數字虛擬人技術在保險業的一個直接應用。外形設計上,數字員工要端莊干練,體現金融從業人員的專業性,在與人交互過程中要能夠理解用戶的問詢意圖,并口齒清晰,親切自然地給出一致的專業解答。
這一過程涉及到計算機圖形學,語音識別、語音合成、自然語言理解等技術的綜合應用,其中最重要的技術難點就是多模態模型的融合,如:建模中聲音和面目表情需要一致,語言、動作、神態三者也需要協調統一,更高質量的融合才能有真實、自然、飽滿的人物形象,才有更高的用戶接受度。
另外,在產品市場化過程中,不同地域用戶會有個性的表達習慣,以及使用口音方言表達的情況,對這些不同語音特征的識別也是語音識別重要的技術挑戰。
再次,不同的用戶群體,會有不同偏好的交互習慣,符合用戶群體的數字員工的性格、人設,可以提升用戶體驗,針對特定類型的員工,如虛擬投保經理,可以提高用戶粘性,增加交易機會。
解決方案
以專業咨詢和數據方案設計的底層能力為支撐,為客戶提供了成品語音數據集結合定制化數據采集標注服務的數據交付方案。
首先,針對多模態融合,表情、語音一致性這一不足,結合過往數字人項目專家知識提供定制采標服務,擴充訓練集。面部表情采集使用相機陣列完整捕捉模特全部面目表情,語音采集使用貼合落地場景的設備進行采集。采集后的語音和面部表情經過檢查,保證時間對齊,減少客戶后續數據處理成本。
對于客戶數字員工應用重點區域進行分析,提供重點區域方言、重口音,識別優惠活動大廳,直接幫助模型迭代增加語音識別準確性。
在數字員工交互回答部分,提供金融行業領域相關語音合成數據成品集,是數字員工的回答更加富有親和力、具有專業感。
使用的部分數據集產品
語音識別(ASR)成品數據集
金融領域多輪對話文本樣例
語音合成(TTS)成品數據集
成品數據集經過自研數據采集及標注平臺處理,專業團隊根據行業領先標準對數據進行清洗、標注、質檢驗收,端到端的數據處理機制充分保證了數據的高質量及合規性。
價值傳遞
優惠活動大廳通過運用賦能的語音識別、語音合成以及數字虛擬人技術,客戶構建了涵蓋智能對話系統和虛擬形象的全新數字員工。客戶將數字員工引入其運營體系中,在智能營銷、智能客服、智能理賠等多個與客戶交互的場景落地,顯著降低了運營成本,實現了工作流程優化。同時高性能的語音識別和語音合成與靈動的數字員工形象整體提高客戶數字員工產品的市場接受度,擴大了客戶用戶群體,實現了降本增效的目標。