fbpx

明家 Paul Lee 與中大團隊合作,利用AI語音合成幫助舌癌母親留住聲線

試想像一下我們幾十年來聽慣媽媽的聲音,突然之間告訴你,以後你也聽不到! 你能接受嗎?JobTotal 為大家分享一個科創研究幫助到香港市民的感人故事。

故事背景

Jackson 的母親 Jody 舌癌復發,須接受手術切除舌頭及聲帶組織。Jody 深知自己手術後再無法發聲,心願是希望兒子記得自己的聲音。Jackson覺得僅僅【記得聲音】很抽象,於是在連登討論區(LIHKG) 發帖求助,未幾被香港中文大學電子工程團隊發現。團隊利用人工智 能(AI) 語音合成技術,把 Jody 的聲音還原,又夥拍本地科企 Ximplar 的 Paul Lee 開發專用應用程式(App),協助手術後失聲的Jody,透過手機以自己的聲音跟他人溝通。 

中大團隊和Paul 合作所研發的手機程式,主要讓Jody 把輸入的文字,轉化成她本人聲音播出。Jody手術前的錄音和轉化後的聲音相似度頗高,語音質素接近即場錄音,沒有機械發聲的感覺。 

團隊為 Jody 錄音的時候,距離 Jody 月底接受手術不足兩星期,團隊以採集數據訓練 AI 模型,把錄音去蕪存菁(如刪去停頓位)後,最終可用以訓練 AI 模型的有效數據,只約7至8小時。 錄音內容主要包括日常說話 (例如你會唔會參加下星期嘅派對)、講兒童故事和誦讀聖經等。 


本地科企尚普Ximplar 董事長李沛鏜-Paul Lee 與中大合作研發

完成AI 模型訓練後,接下來中大團隊找來之前曾一同研發聽力測試方案的本地科企尚普 Ximplar 董事長李沛鏜-Paul Lee,以及該公司的軟件工程師雷淇鈞,由他們花約兩星期製成首個版本的手機程式。李沛鏜坦言,程式有不少地方要改進,只能邊用邊改。例如現時程式容許 Jody 把 AI 合成的語音,分享至 WhatsApp、Telegram 等通訊軟件,這功能是根據Jackson 的意見而增設的。中大團隊則希望進一步運用 AI 及GPS (全球衞星定位)技術,按照Jody 身處位置作出句子建議。 身為用家的Jody 透過程式表示,「自己平時好鍾意講嘢……非常感謝大家為我製作呢個程式,我感覺真係留低咗我把聲。」李沛鏜及雷淇鈞相信,若將AI 語音合成模型直接存放在手機,資料載入速度有望加快,惟需要不時手動清除資料及快取,以免手機容量被擠爆。 

相信 Paul 與中大不斷的科研改進,可以令到App 越來越完善,也可以幫助更多類似 Jody 的朋友們!香港的科創也可以見到光明的未來,勵志投入此行業的新人也應努力裝備自己, 研發更多造福大眾的產品。


李沛鏜先生

「聽優」發明者 尚普有限公司行政總裁 及創辦人

李沛鏜創辦尚普有限公司,一向以創造簡單易用的 方案為目標。他相信現代化科技已滲入生活各個層面, 但使用上還有很多的改善空間。

李沛鏜先生利用專業電子工程知識和多年管理顧問經驗,於 90 年代 開始,曾參與創辦多間矽谷始創公司。他憑著化繁為簡以及第一手的前線經 驗,協助企業將難題迎刃而解。作為一個土生土長的香港人,李沛鏜先生深 信香港擁有成為世界級創新基地的條件及優勢,並於  2007 年回流返港成立 尚普有限公司,為香港科技界出一分力。

李沛鏜先生共同研發的「聽優」技術,為有聽力問題人士提供一個生 活改善方案。此技術已在世界各地申請多項專利,並獲得 2011 年華爾街日 報頒發的「亞洲創新獎」獎狀。

李沛鏜 Paul Lee 

尚普有限公司 Co-Founder