項目名稱:建立和驗證雲端智能中文讀寫障礙檢測系統

資助來源:研究資助局2020/2021年度本地自資學位界別競逐研究資助計劃 – 教員發展計劃 

資助金額:HK$ 1,192,011 

首席研究員:袁文貞博士(應用數據科學系助理教授) 

項目年期:24個月 

 

在香港,如要識別學童是否有中文發展性讀寫障礙developmental dyslexia,大都使用紙本測試,至於採用機器學習方法作為評估工具,以及與此相關的學術研究,則並不多見。應用數據科學系助理教授袁文貞博士開展的研究項目,是利用雲端平台,開發一套基於機器學習的軟件,用識別繁體字的讀寫障礙。她的研究成果將可為讀寫障礙評估專家、教師和家長,提供一個快速又簡便的中文讀寫障礙檢測法。 

袁博士對《樹仁簡訊》表示,世界各地有不少有發展性讀寫障礙,這是一種影響閱讀和寫作技能的特殊學習障礙。有研究發現,全球約有17%的人口有讀寫障礙。 

檢測讀寫障礙是針對有讀寫障礙的學童進行臨床或教學協助的第一步,過程是將懷疑有讀寫障礙的學童轉介到測驗中心進行讀寫障礙評估。但在香港,讀寫障礙評估服務的等候時間通常很長,評估程序非常複雜,而且評估的準確性可能受到教師的偏見所影響。 

據袁博士表示,與英語讀寫障礙相比,檢測中文讀寫障礙要難得多,而學習繁體中文字比學習簡體中文字也困難得多。現在,有許多關於識別簡體中文字的讀寫障礙的著作,但是,有關識別繁體中文字的讀寫障礙的著作很少。現有的大多數研究都集中在利用紙作為評估的工具,同時,現有的著作中只有很少一部分致力於使用機器學習方法作為評估的工具而即使採用了,沒有解決機器學習方法需要長時間運算的問題。 

為了解決上述問題,袁博士利用雲端平台,開發一套基於機器學習的軟件,用來識別繁體字的讀寫障礙,以致優化檢測的準確性和處理運算的時間。這個軟件可以為檢測讀寫障礙的測驗中心、教師和父母,提供一個快速又簡便的檢測讀寫障礙的方法。 

按照袁博士的規劃,她和她的團隊會在雲端平台上進行智能中文讀寫障礙檢測系統的設計、開發和驗證。項目6個階段進行: 

第一階段:回顧有關識別讀寫障礙的文獻,目的是收集大量有關讀寫障礙的評估的資料,繼而編寫能區分不同程度的讀寫障礙的單詞集,切合智能中文讀寫障礙檢測系統的用戶的要求。 

第二階段:邀請有讀寫障礙的學童和沒有讀寫障礙的學童,寫出相同的單詞,其目的是確保所選的繁體中文字的特徵,具有代表性,可以用作機器學習模型訓練數據集 

第三階段:使用亞馬遜雲端運算服務,開發雲計算評估系統。在亞馬遜雲端平台上開發出經過訓練的機器學習模型後,袁博士會將模型集成在檢測系統內,然後再將檢測系統部署在雲端基礎架構上。用戶可以在網頁瀏覽器上使用檢測系統。 

第四階段:評估檢測系統的性能。袁博士和她的團隊會邀請有讀寫障礙的學童和沒有讀寫障礙的學童,測試檢測系統,以確定識別讀寫障礙的預測準確性。 

第五階段:袁博士會在學校舉辦研討會和工作坊,介紹其智能中文讀寫障礙檢測系統 

第六階段:袁博士會使用檢測結果撰寫適用於人工智能、機器學習、雲計算、教育心理學、特殊教育、語音和語言領域的技術報告和研究論文。 

據袁博士表示,她會聯絡提供讀寫障礙服務的志願機構,邀請他們的專家、學者和社工等,組成一個顧問委員會,為研究提供意見,並就如何利用研究成果增加公眾對讀寫障礙的認知,提供建議 

袁博士說:「評估中心、教師和家長可以使用這智能中文讀寫障礙檢測系統,作為識別發展性讀寫障礙的簡單快速方法。我相信檢測系統收集的數據,將對研究人員分析讀寫障礙的表現,以及了解如何有效識別讀寫障礙,有很大的幫助。」 

來源:2021年1月號